文章预览
昨天看到一则新闻: NP难问题接近被AI破解!南航牛津爆改DeepSeek-R1推理 (来源:新智元) 讲的是南航、南通大学、牛津等机构的研究者发现,利用 高指令的推理提示 ,可以大幅提升 DeepSeek-R1 等大模型的数学推理能力,甚至有望解决 NP-hard 问题。 论文地址:https://arxiv.org/abs/2502.20545 这项研究的突破点在于,他们构建了一个名为 SoS-1K 的数学数据集,其中包含 1000 个精心设计的多项式问题,并搭配了 五类专家级推理指导 。这些指导帮助 LLM(大语言模型)在解数学难题时模拟人类数学家的推理过程,而不是简单的模式匹配。结果表明,DeepSeek-R1、Qwen2.5 等模型在数学推理任务上的正确率最高提升了 21%,远超随机猜测基线。 但更令人震惊的是, Qwen2.5-14B 居然找到了希尔伯特第十七问题的一个全新反例! 要知道,希尔伯特第十七问题最早由数学家
………………………………