当前速讯：多项测试超越90%的人类，GPT-4会引发新一轮风暴吗

微信微博 QQ空间 MORE

关注河南热线

3月15日，美东时间3月14日，OpenAI宣布推出大型语言模型的最新版本——GPT-4，该版本比以前的版本“更大”，称它可以接收图像和文本输入，输出文本，“比以往任何更具创造性和协作性”，并且“由于它有更广泛的常识和解决问题的能力，可以更准确地解决难题”。在内部评估中，它产生正确回应的可能性比GPT-3.5高40%。它将用于付费版ChatGPT Plus。

【资料图】

ChatGPT是最近科技界最火爆的话题，GPT-3是世界上最大的大语言模型之一，其惊人的表现也让外界猜测下一代的GPT-4到底有多强大。

OpenAI官方发布的宣传片中GPT的最新一代版本ChatGPT-4，相比上一代，其AI能力再度提升，同时支持输入的内容不再仅限于文字，还支持图像内容的输入，成为一个能够理解照片的人工智能。虽然ChatGPT-4未能实现音频解析，但新功能让人兴奋不已。

同时根据OpenAI介绍，GPT-4是一个多模态大型语言模型，即支持图像和文本输入，以文本形式输出；扩写能力增强，能处理超过25000个单词的文本。

OpenAI表示，新模型将产生更少的错误答案，更少地偏离谈话轨道，更少地谈论禁忌话题，甚至在许多标准化测试中比人类表现得更好。例如，GPT-4模拟律师考试的成绩在考生中排名前10%左右，在SAT阅读考试中排名前7%左右，在SAT数学考试中排名前11%左右。

虽然GPT-4更具创造力，并且能够处理更细微的指令，但官方也警告说，这些系统保留了许多与早期语言模型相同的问题，包括编造信息的倾向以及生成暴力和有害文本的能力，尽管如此，用户们还是为之振奋。

北京商报记者向GPT-4和GPT-3.5中输入“帮我出一个北京一日游的攻略”的问题。

由输入结果可知，在北京一日游的攻略中GPT-4明显时间安排与提醒更加细致贴心，内容上更丰富清晰，而同时GPT-3.5出现了序号错误。

再向二者输入第二个问题“解释一下幂函数”。

从答案可以看出，在幂函数的介绍上，GPT-4与GPT-3.5相比清晰地将定义、举例、应用表达出来，更具有逻辑性。

接着再同时输入“哈利波特是怎样的魔法师”。

在对哈利波特的介绍中，将“父母在他很小时被黑巫师伏地魔杀害”的内容表述成“年幼失去双亲”，显然GPT-4在语言上更加精炼。

GPT-4在不断学习之下，ChatGPT也变得更为聪明、准确。GPT-4相较于GPT-3.5更加具备规范和精确的语言能力，同时也具备更精确的知识。

据报道，GPT-4多项测试超越90%的人类，这不免成为人们关注的焦点。

北京光大银行(601818)一位计算机程序员向北京商报记者表示，目前对于银行这种要求严谨精确的系统来讲，短期内程序员是不会被机器替代的，机器还是存在更多的不确定性。在银行一直使用的是较为“老”而稳定的程序。

GPT-4的更新让大众受益，同样ChatGPT的开发者OpenAI在GPT-4的研发上已经取得了不少进展，各种猜测纷纭，有说其训练参数高达100万亿的，有说微软已经把GPT-4纳入最新版本的必应中。

本周，AI行业或将迎来“疯狂星期四”。百度此前宣布，将于3月16日（周四）发布旗下首款类ChatGPT产品“文心一言”。微软也透露，本周内将推出拥有更高性能的GPT-4。虽然目前尚未透露具体发布时间，不过考虑到3月16日也是微软的AI活动日，活动主题为“用人工智能重塑生产力”，而公司CEO将上台演讲，外界普遍认为当天这款产品将正式亮相。

北京商报记者陶凤实习记者李想

责任编辑：hN_1627

什么是动静脉内瘘？动静脉内瘘术后怎么护理？
动静脉内瘘是外科手术之一，主要用于血液透析治疗。动静脉内瘘术是一种血管吻合的小手术，将前臂靠近手腕部位的动脉和邻近的...
右上腹部隐痛是怎么回事？右上腹疼痛是肝癌前兆吗？
1、肝炎：多由肝炎病毒感染引起，可导致肝细胞死亡或凋亡，从而引起肝脏炎症、坏死，在炎症刺激下，可出现右上腹部隐隐作痛的...
什么是命名性失语？命名性失语会恢复到什么程度？
命名性失语(anomicaphasia,AA)又称健忘性失语(amnesticaphasia),它是指命名不能(anomia)为唯一的或主要症状的失语。口语表达表现找词困难，
刷牙牙龈出血是怎么回事？每天刷牙都出血危险吗？
刷牙时牙龈出血，可能是牙龈炎或者牙周病。在牙龈炎或者是牙周病时，会出现牙龈的红、肿、热、痛，触碰时容易出血。所以，触...
卵巢囊肿破裂怎么办？消除卵巢囊肿的最佳方法是什么？
1、随访观察：如果患者的卵巢囊肿一直没有增大，且没有引起下腹部疼痛等症状，此时通常为卵巢囊肿破裂，但并未导致血管破裂，...