专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
今天看啥  ›  专栏  ›  DeepTech深科技

思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理

DeepTech深科技  · 公众号  · 科技媒体  · 2024-09-19 18:22

文章预览

几天前 OpenAI 新模型 o1 的发布,再次引发了人们对大语言模型的高度关注和讨论。 而 o1 发布之所以如此“轰动”,是因为它与此前大模型由语言驱动用于聊天或语音助手有本质的不同。其不仅进入到复杂的领域,还表现出超强的推理能力。 OpenAI  将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果,二者差异显著,其中,前者正确解决问题的准确率是 13.4%,而 o1 的准确率则能够达到 83.3%。 这种推理能力的重要意义在于,有望在更广泛的领域应用,例如,药物发现、材料 科学 、编程、高等数学和物理等。 o1 实现超强推理能力的原因在于它的思考能力,而这背后源于强化学习和思维链(CoT,Chain of Thought)。 这意味着,大模型在给出答案之前,会有一种类似人类思考的过程,然后进行推理。 就在人们对大模型的推理能力 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览