谷歌AI解决IMO中84%的几何问题，o1一道没做对！Nature：AI已超过金牌得主平均水平

哲学园 · 公众号 · 哲学 · 2025-02-10 00:00

主要观点总结

谷歌DeepMind的最新数学AI AlphaGeometry2解决了2000-2024年IMO竞赛中84%的几何问题。AlphaGeometry2通过扩展领域专用语言、升级符号推理引擎DDAR2、全新的搜索算法SKEST以及更强大的语言模型取得了大幅提升。论文发文评价称其达到金牌得主水平。DeepMind的核心研究方向是强化学习，而Gemini类大模型则依赖海量数据和Transformer架构。两者代表了AI发展的不同范式，未来可能结合发展。

关键观点总结

关键观点1: AlphaGeometry2解决IMO竞赛几何问题

AlphaGeometry2一举解决了2000-2024年IMO竞赛中84%的几何问题，其中论文提到的具体案例包括构造辅助线解决难题等。

关键观点2: AlphaGeometry2的四大升级

AlphaGeometry2通过扩展领域专用语言、升级符号推理引擎DDAR2、全新的搜索算法SKEST以及更强大的语言模型等四大升级取得显著进步。

关键观点3: DeepMind与Gemini类大模型的区别

DeepMind以强化学习为核心，追求在封闭问题域内实现超人性能，而Gemini类大模型依赖海量数据和Transformer架构。两者代表了AI发展的不同范式，未来可能结合发展。

文章预览

梦晨发自凹非寺量子位 | 公众号 QbitAI 谷歌 DeepMind 最新数学AI，一举解决了2000-2024年IMO竞赛中 84% 的几何问题。 AlphaGeometry2 论文发布，在总共50道题中完成了42道，相比去年的一代多完成了15道。作为对比，纯语言模型OpenAI o1和Gemini Flash Thinking一道都解决不了。 Nature发文评价：DeepMind AI粉碎了数学难题，达到金牌得主水平，与顶级人类选手相当。就比如说2024年竞赛中的第四题，AlphaGeometry2 完成它只需要19秒。如图所示，这道题要求证明∠KIL和∠XPY的合等于180°（蓝色表示）。 AlphaGeometry2构造的辅助线用红色表示，E是BI延长线上的点，使得∠AEB=90°，通过E点进一步得到了几对相似三角形，最终完成证明。通讯作者Thang Luong 分享了更疯狂的一道题，来自IMO Shortlist 2009。根据谷歌咨询的IMO教练，此问题以前仅有数值解。但AlphaGeometry2巧妙地构造出了 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博