Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华人大出品

量子位 · 公众号 · AI · 2025-01-18 12:28

文章预览

衡宇白小交发自凹非寺量子位 | 公众号 QbitAI 一个新框架，让Qwen版o1成绩暴涨：在博士级别的科学问答、数学、代码能力的11项评测中，能力显著提升，拿下10个第一！这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」 Search-o1 的特别之处。项目团队成员发现，o1和o1类模型在推理过程中表现突出，但却存在“知识不足”的明显缺陷—— 推理步骤太长/模型知识不足时，推理过程就很容易卡壳，导致推理链中的错误传递。而其中任何知识误差都可能破坏整个推理链，最终对答案的正确性造成影响。好着急，在线等，怎么办？ Search-o1的解题思路是：暂停推理，去搜索查找缺少的知识/资料，然后再回来继续推理。就像咱人类思考不明白，就去查查资料，然后就想明白了似的。研究者在初步实验中发现，类o1推理模型在处理复杂问题 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【[253星]MegaTTS3：字节跳动推出的高效语音合成项目，-20250329124458

昨天

爱可可-爱生活 · 【[60星]STEVE-R1：一款强大的计算机操作Agent，助-20250329125003

昨天

黄建同学 · 牛津大学新的研究：SynCity: Training-Free -20250329081212

昨天

宝玉xp · Krisp利用AI技术，让印度人在通话中拥有美国口音作者：Iva-20250328130504

2 天前

爱可可-爱生活 · //@爱可可-爱生活:欢迎参与！-20250328060531

3 天前

商业地产观察 · 北京2024年将新开这些地铁，利好哪些商业项目？

10 月前

期权时代 · 用GammaScalping策略捕捉期权定价偏差

9 月前

跨境营销中心 · Facebook主页如何发帖？提高互动率的6个技巧

7 月前