专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

27亿刀天价员工首个成果,谷歌版o1算出最难高考数学题!物理代码难题闪电秒解

新智元  · 公众号  · AI  · 2024-12-20 17:24
    

主要观点总结

谷歌新模型Gemini 2.0 Flash Thinking的发布引起了广泛关注。该模型在Chatbot Arena中横扫所有类别,展现了强大的能力。它能够在短时间内解决复杂的数学、物理和代码难题,并展示出详细的推理过程。此模型似乎是谷歌天价请回Noam Shazeer后的首个成果,引发了外界对谷歌在AI领域的实力的认可。

关键观点总结

关键观点1: Gemini 2.0 Flash Thinking的发布和强大表现。

该模型是谷歌的新产品,能够在短时间内解决各种复杂的数学问题、物理问题和代码难题,并在Chatbot Arena中取得优异的成绩。它的推理过程清晰,能够展示思考过程。

关键观点2: 谷歌请来Noam Shazeer对此模型的贡献。

据外媒报道,Flash Thinking是著名AI研究员Noam Shazeer进入谷歌后的首个工作成果。这进一步证明了谷歌在人工智能领域的实力。

关键观点3: 模型的响应速度和解题能力。

Flash Thinking在响应速度方面表现出色,在某些情况下,它的响应速度是OpenAI o1模型的两倍。此外,它还能解决复杂的数学题、物理题,甚至包括涉及视觉和文本线索的挑战性难题。

关键观点4: 模型的广泛应用和网友的评价。

网友们对Gemini 2.0 Flash Thinking的强大能力表示惊叹,并将其与OpenAI的o1模型进行比较。他们纷纷测试新模型,并对其解决问题的能力表示赞赏。


文章预览

   新智元报道   编辑:编辑部 HYZh 【新智元导读】 谷歌版o1震撼登场,一诞生直接屠榜了Chatbot Arena,横扫所有类别。复杂数学、物理、代码难题都能解决,思考速度快如闪电。更劲爆的是,此模型似乎是谷歌天价请回沙哥Noam Shazeer后,他的首个成果,27亿美元花得值了。 OpenAI十二天直播,杀疯了的竟然是谷歌。 就在深夜,「谷歌版o1」Gemini 2.0 Flash Thinking突然发布。 跟o1的策略类似,它同样是将更多计算能力投入「推理时计算」——即模型实际解决问题的时长。 但不一样的是,Flash Thinking能清晰地展示思考过程。 一经发布,它就直接屠榜Chatbot Arena。 从战绩来看,新模型在总榜位列第一,数学榜单第一,创意写作第一,Hard Promt第一,视觉榜单第一! 举一个比较复杂的概率问题的例子。 如果一直掷硬币,直到得到「正正正」或「正反正」,得到 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览