专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

27亿刀天价员工首个成果，谷歌版o1算出最难高考数学题！物理代码难题闪电秒解

新智元 · 公众号 · AI · 2024-12-20 17:24

主要观点总结

谷歌新模型Gemini 2.0 Flash Thinking的发布引起了广泛关注。该模型在Chatbot Arena中横扫所有类别，展现了强大的能力。它能够在短时间内解决复杂的数学、物理和代码难题，并展示出详细的推理过程。此模型似乎是谷歌天价请回Noam Shazeer后的首个成果，引发了外界对谷歌在AI领域的实力的认可。

关键观点总结

关键观点1: Gemini 2.0 Flash Thinking的发布和强大表现。

该模型是谷歌的新产品，能够在短时间内解决各种复杂的数学问题、物理问题和代码难题，并在Chatbot Arena中取得优异的成绩。它的推理过程清晰，能够展示思考过程。

关键观点2: 谷歌请来Noam Shazeer对此模型的贡献。

据外媒报道，Flash Thinking是著名AI研究员Noam Shazeer进入谷歌后的首个工作成果。这进一步证明了谷歌在人工智能领域的实力。

关键观点3: 模型的响应速度和解题能力。

Flash Thinking在响应速度方面表现出色，在某些情况下，它的响应速度是OpenAI o1模型的两倍。此外，它还能解决复杂的数学题、物理题，甚至包括涉及视觉和文本线索的挑战性难题。

关键观点4: 模型的广泛应用和网友的评价。

网友们对Gemini 2.0 Flash Thinking的强大能力表示惊叹，并将其与OpenAI的o1模型进行比较。他们纷纷测试新模型，并对其解决问题的能力表示赞赏。

文章预览

新智元报道编辑：编辑部 HYZh 【新智元导读】谷歌版o1震撼登场，一诞生直接屠榜了Chatbot Arena，横扫所有类别。复杂数学、物理、代码难题都能解决，思考速度快如闪电。更劲爆的是，此模型似乎是谷歌天价请回沙哥Noam Shazeer后，他的首个成果，27亿美元花得值了。 OpenAI十二天直播，杀疯了的竟然是谷歌。就在深夜，「谷歌版o1」Gemini 2.0 Flash Thinking突然发布。跟o1的策略类似，它同样是将更多计算能力投入「推理时计算」——即模型实际解决问题的时长。但不一样的是，Flash Thinking能清晰地展示思考过程。一经发布，它就直接屠榜Chatbot Arena。从战绩来看，新模型在总榜位列第一，数学榜单第一，创意写作第一，Hard Promt第一，视觉榜单第一！举一个比较复杂的概率问题的例子。如果一直掷硬币，直到得到「正正正」或「正反正」，得到 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博