新版ChatGPT火速发布：十大改进变厉害但仍存缺陷

微信微博 QQ空间 MORE

关注河南热线

OpenAI发布GPT-4

凤凰网科技讯北京时间3月15日消息，美国人工智能研究实验室OpenAI周二为其爆红聊天机器人ChatGPT发布了最新GPT-4语言模型，这距离ChatGPT的上线仅仅过去了4个月时间。

外媒称，和ChatGPT最初使用的GPT-3.5模型相比，GPT-4带来十大改进，提升了准确率等功能，但是依旧存在错误、“幻觉”等不足。

(资料图片)

以下是外媒汇总的GPT-4主要改进和不足：

更精确

人工智能专家、风险投资公司Page One Ventures合伙人克里斯·尼克尔森(Chris Nicholson)告诉GPT-4，自己的母语是英语，不懂西班牙语。他希望GPT-4给他一份可以教他西班牙基础知识的教学大纲。结果，GPT-4提供了一份详细而有条理的教学大纲。它甚至为学习和记忆西班牙语单词提供了广泛的技巧，尽管并不是所有建议都中肯。

准确性提高

GPT-4比GPT-3.5更准确

它还提高了准确性。当人工智能研究员兼教授奥伦·埃齐奥尼(Oren Etzioni)第一次尝试使用GPT-4时，他问了一个直截了当的问题：“奥伦·埃齐奥尼和伊莱·埃齐奥尼(Eli Etzioni)之间是什么关系?”机器人的反应是正确的，称两人是父子关系。相比之下，GPT-3.5的回答则是错误的，称他们两人是兄弟关系。但是，GPT-4也存在错误。它说，奥伦是奥伦人工智能研究所的CEO，但实际上奥伦已经卸任了这一职位。

更详细描述图像

能详细描述图像

GPT-4能够对图像和文本做出惊人的详细描述。OpenAI总裁兼联合创始人格雷格·布罗克曼(Greg Brockman)演示了该系统如何细致地描述来自哈勃太空望远镜的图像。它还可以回答有关图像的问题。如果给出一张冰箱内部的照片，它就能建议你用手边的东西做几顿饭。

擅长标准化考试

OpenAI表示，新系统可以在美国41个州和地区的统一律师资格考试(UBE)中获得前10%左右的成绩。根据该公司的测试，它还可以在SAT考试中获得1300分(满分1600分)，在高中生参加的大学生物、微积分、宏观经济学、心理学、统计学和历史先修课程考试中获得5分(满分5分)。

不擅长讨论未来

尽管这个新的机器人似乎能对已经发生的事情进行推理，但当被要求对未来进行假设时，它就不那么擅长了。它似乎是在借鉴别人的说法，而不是创造新的猜测。

仍会产生幻觉

新的机器人还是会瞎编。这个问题被称为人工智能“幻觉”，困扰着所有领先的聊天机器人。由于系统不知道什么是真的，什么是假的，它们可能会生成完全错误的文本。当被要求提供描述最新癌症研究的网站地址时，它有时会生成不存在的互联网地址。(作者/箫雨)

责任编辑：hN_1527

什么是动静脉内瘘？动静脉内瘘术后怎么护理？
动静脉内瘘是外科手术之一，主要用于血液透析治疗。动静脉内瘘术是一种血管吻合的小手术，将前臂靠近手腕部位的动脉和邻近的...
右上腹部隐痛是怎么回事？右上腹疼痛是肝癌前兆吗？
1、肝炎：多由肝炎病毒感染引起，可导致肝细胞死亡或凋亡，从而引起肝脏炎症、坏死，在炎症刺激下，可出现右上腹部隐隐作痛的...
什么是命名性失语？命名性失语会恢复到什么程度？
命名性失语(anomicaphasia,AA)又称健忘性失语(amnesticaphasia),它是指命名不能(anomia)为唯一的或主要症状的失语。口语表达表现找词困难，
刷牙牙龈出血是怎么回事？每天刷牙都出血危险吗？
刷牙时牙龈出血，可能是牙龈炎或者牙周病。在牙龈炎或者是牙周病时，会出现牙龈的红、肿、热、痛，触碰时容易出血。所以，触...
卵巢囊肿破裂怎么办？消除卵巢囊肿的最佳方法是什么？
1、随访观察：如果患者的卵巢囊肿一直没有增大，且没有引起下腹部疼痛等症状，此时通常为卵巢囊肿破裂，但并未导致血管破裂，...