专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

Search版o1:推理过程会主动查资料,整体性能优于人类专家,清华人大出品

量子位  · 公众号  · AI  · 2025-01-18 12:28
    

文章预览

衡宇 白小交 发自 凹非寺 量子位 | 公众号 QbitAI 一个新框架,让Qwen版o1成绩暴涨 : 在博士级别的科学问答、数学、代码能力的11项评测中,能力显著提升,拿下10个第一! 这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」 Search-o1 的特别之处。 项目团队成员发现,o1和o1类模型在推理过程中表现突出,但却存在“知识不足”的明显缺陷—— 推理步骤太长/模型知识不足时,推理过程就很容易卡壳 ,导致推理链中的错误传递。而其中任何知识误差都可能破坏整个推理链,最终对答案的正确性造成影响。 好着急,在线等,怎么办? Search-o1的解题思路是:暂停推理,去搜索查找缺少的知识/资料,然后再回来继续推理。 就像咱人类思考不明白,就去查查资料,然后就想明白了似的。 研究者在初步实验中发现,类o1推理模型在处理复杂问题 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览