专家级推理指导如何让 AI 变成数学天才？

模型视角 · 公众号 · · 2025-03-05 11:30

文章预览

昨天看到一则新闻： NP难问题接近被AI破解！南航牛津爆改DeepSeek-R1推理（来源：新智元）讲的是南航、南通大学、牛津等机构的研究者发现，利用高指令的推理提示，可以大幅提升 DeepSeek-R1 等大模型的数学推理能力，甚至有望解决 NP-hard 问题。论文地址：https://arxiv.org/abs/2502.20545 这项研究的突破点在于，他们构建了一个名为 SoS-1K 的数学数据集，其中包含 1000 个精心设计的多项式问题，并搭配了五类专家级推理指导。这些指导帮助 LLM（大语言模型）在解数学难题时模拟人类数学家的推理过程，而不是简单的模式匹配。结果表明，DeepSeek-R1、Qwen2.5 等模型在数学推理任务上的正确率最高提升了 21%，远超随机猜测基线。但更令人震惊的是， Qwen2.5-14B 居然找到了希尔伯特第十七问题的一个全新反例！要知道，希尔伯特第十七问题最早由数学家 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

医药魔方Info · 乐普生物EGFR ADC申报上市

6 月前

柳叶刀财经 · 东升西降

5 月前

粥左罗 · “保研发朋友圈屏蔽了300多人”上热搜：嫉妒，可以让人多疯狂？

5 月前

粥左罗 · “保研发朋友圈屏蔽了300多人”上热搜：嫉妒，可以让人多疯狂？

5 月前

短剧新势力 · 开启报名｜第四届短剧产业对接大会将于2025年3月12日上海启幕

4 月前