专栏名称: 多知
专注于报道培训教育领域,有意思,有价值,有细节,有深度
目录
今天看啥  ›  专栏  ›  多知

推理大模型来了,OpenAI o1解答物理、生物和化学问题水平超越人类博士

多知  · 公众号  ·  · 2024-09-14 00:00

文章预览

推理能力提升带来范式变化。 来源 | 多知 作者|Penny 9月12日晚,OpenAI开发了一系列新的人工智能模型, 旨在让大模型花更多时间思考后再做出反应。它们可以推理复杂的任务,解决比以前的科学、编码和数学模型更难的问题。 根据OpenAI的官方博客显示,OpenAI o1 在竞争性编程问题(Codeforces)中排名第 89 位,在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列, 并在物理、生物和化学问题 (GPQA) 基准测试中超越人类博士级准确度。 OpenAI o1 就是此前被传的内部代号为“草莓”的项目,这是一个不同于大语言模型的新模型,更像一个推理模型。 (OpenAI o1 显示思考时间) 除了官方博客,OpenAI还发布了o1的多个视频,包括解数学题、做贪吃蛇游戏、破译韩文、破解逻辑谜题、解答量子物理等。可以看到,o1的推理能力得到极大提升,带来范式的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览