GPT-4重磅发布：不仅吊打ChatGPT，还吊打90%的人类？！

更新于2023-03-15 17:23

ChatGPT刷屏热潮还没过，其开发商OpenAI又扔下一枚重磅炸弹。

强势来袭

美东时间3月14日，OpenAI公布了其大型语言模型的最新版本——GPT-4。

据OpenAI介绍，GPT-4是一个多模态大型语言模型，能接受图像和文本输入，输出文本内容。虽然GPT-4在许多现实场景中的能力不如人类，但在各种专业测试和学术基准上的表现与人类水平相当。

比如，在美国BAR律师执照统考模拟中，GPT-4在考生中排名前10%左右，击败了90%的人类；在“美国高考”SAT的数学考试中，GPT-4得分约为前11%。

由于出众的考试能力，GPT-4甚至被网友戏称为“硅谷做题家”。

功能大升级

对于外界关注的GPT-4与其前身GPT-3.5（ChatGPT 的基础）之间的区别，OpenAI在其报告中也给出了详细的对比说明。

从下图可以看出，在大多数为人类设计的模拟考试中，GPT-4的表现都远胜于GPT-3.5。

另外，GPT-4对于英语以外的语种支持也得到极大的优化。

在测试的26种语言中，GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能，其中包括部分低资源语言如拉脱维亚语、威尔士语等。在中文语境中，GPT-4能够达到80.1%的准确性。

GPT-4单次提问的字数限制也进行了提升，在对GPT-4提问的时候，一次性能够输入长达25000单词。

值得注意的是，与之前只能处理文本的GPT模型相比，GPT-4功能最大的突破之一就是能接受图像和文本输入，输出文本内容。

比如，GPT-4能看着一张图解释这张图的笑点在哪里，并对图片中的每部分进行描述。

GPT-4还能描述出一张图片的不和谐之处。

GPT-4甚至能阅读论文截图，对内容和图表进行总结和解释。

局限性仍在

尽管功能强大，但GPT-4仍存在局限性。

OpenAI称，它并不完全可靠，可能会出现推理错误，“GPT-4缺乏对绝大多数数据切断后（2021年9月）发生的事件的了解，并且无法从中吸取经验教训……它有时会出现简单的推理错误，它会轻信用户明显的虚假陈述，有时它会像人类一样在难题上失败，例如在它生成的代码中引入安全漏洞。”

基于此，OpenAI提醒，用户在使用语言模型时应格外小心，最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。

另外，GPT-4目前不提供免费版本，仅向ChatGPT Plus的付费订阅用户及企业和开发者开放。

科技巨头内卷继续

据悉，目前已有多家公司要将GPT-4结合到他们的产品中，比如，Stripe使用GPT-4扫描商业网站并向客户支持人员提供摘要，Duolingo将 GPT-4构建到新的语言学习订阅层中。摩根士丹利正在创建一个由GPT-4驱动的系统，该系统将从公司文件中检索信息并将其提供给金融分析师。可汗学院正在利用GPT-4构建某种自动化导师。

GPT-4此番来势汹汹，势必将再次引发全球科技大厂的内卷。

为反击ChatGPT，Google前不久宣布将推出一款名为Bard的实验性对话AI服务。而在昨日，谷歌宣布开放自家的大语言模型 API 「PaLM API」，还发布了一款帮助开发者快速构建AI程序的工具 MakerSuite。谷歌表示，此举是为了帮助开发者们快速构建生成式AI应用。

微软则选择继续扩大与OpenAI的合作伙伴关系，除了向OpenAI追加数十亿美元投资，微软还将ChatGPT整合入自家搜索引擎Bing，以及Office办公套件：Word、Excel、PPT。

值得注意的是，被视为中国版ChatGPT的百度AI产品“文心一言”将于3月16日发布。

主编精选，篇篇重磅，请点击订阅“邮件订阅”

编辑：Ke

北美商业电讯

GPT-4重磅发布：不仅吊打ChatGPT，还吊打90%的人类？！

ChatGPT

特斯拉因虚假广告在韩国被罚款225万美元

英伟达加码，马斯克旗下xAI再获60亿美元！总融资达120亿美元

又挂了！ChatGPT和Sora本月第二次宕机，苹果AI未受影响

CES 2025最新前瞻！正式开幕前5场关键发布会，AI仍是重头戏

砸200亿美元！阿联酋顶级开发商将在美建数据中心，与川普关系深厚

热门话题