专栏名称: 哲学园
哲学是爱智慧, 爱智慧乃是对心灵的驯化。 这里是理念的在场、诗意的栖居地。 关注哲学园,认识你自己。
今天看啥  ›  专栏  ›  哲学园

谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平

哲学园  · 公众号  · 哲学  · 2025-02-10 00:00
    

主要观点总结

谷歌DeepMind的最新数学AI AlphaGeometry2解决了2000-2024年IMO竞赛中84%的几何问题。AlphaGeometry2通过扩展领域专用语言、升级符号推理引擎DDAR2、全新的搜索算法SKEST以及更强大的语言模型取得了大幅提升。论文发文评价称其达到金牌得主水平。DeepMind的核心研究方向是强化学习,而Gemini类大模型则依赖海量数据和Transformer架构。两者代表了AI发展的不同范式,未来可能结合发展。

关键观点总结

关键观点1: AlphaGeometry2解决IMO竞赛几何问题

AlphaGeometry2一举解决了2000-2024年IMO竞赛中84%的几何问题,其中论文提到的具体案例包括构造辅助线解决难题等。

关键观点2: AlphaGeometry2的四大升级

AlphaGeometry2通过扩展领域专用语言、升级符号推理引擎DDAR2、全新的搜索算法SKEST以及更强大的语言模型等四大升级取得显著进步。

关键观点3: DeepMind与Gemini类大模型的区别

DeepMind以强化学习为核心,追求在封闭问题域内实现超人性能,而Gemini类大模型依赖海量数据和Transformer架构。两者代表了AI发展的不同范式,未来可能结合发展。


文章预览

梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌 DeepMind 最新数学AI,一举解决了2000-2024年IMO竞赛中 84% 的几何问题。 AlphaGeometry2 论文发布,在总共50道题中完成了42道,相比去年的一代多完成了15道。 作为对比,纯语言模型OpenAI o1和Gemini Flash Thinking一道都解决不了。 Nature发文评价:DeepMind AI粉碎了数学难题,达到金牌得主水平,与顶级人类选手相当。 就比如说2024年竞赛中的第四题,AlphaGeometry2 完成它只需要19秒 。 如图所示,这道题要求证明∠KIL和∠XPY的合等于180°(蓝色表示)。 AlphaGeometry2构造的辅助线用红色表示,E是BI延长线上的点 ,使得∠AEB=90°,通过E点 进 一步得到了几对相似三角形,最终完成证明。 通讯作者Thang Luong 分享了更疯狂的一道题,来自IMO Shortlist 2009。 根据谷歌咨询的IMO教练,此问题以前仅有数值解。 但AlphaGeometry2巧妙地构造出了 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览