专栏名称: AIGC开放社区

专注AIGC（生成式人工智能）领域的专业社区，关注GPT-4、百度文心一言、华为盘古等大语言模型（LLM）的发展应用和落地，以及国内LLM的发展和市场研究，社区秉承共建、共享、开放的理念，提供对社区会员有价值的商业化思路和服务。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

谷歌版o1模型发布：霸榜排名第一，深度展示思维链

AIGC开放社区 · 公众号 · 科技自媒体互联网安全 · 2024-12-20 04:19

主要观点总结

本文介绍了谷歌DeepMind推出的全新测试模型——Gemini 2.0 Flash Thinking。该模型基于2.0 Flash版本，采用类似o1模型的慢思维思考方式，可深度可视化展示整个思维链过程。它支持多模态推理，能在执行数学、编程等复杂问题时完完整整地展现出所有的推理过程。根据Chatbot Arena LLM Leaderboard最新评测数据，Thinking模型在多个基准测试中排名第一。谷歌和OpenAI的竞争愈发激烈，而Thinking模型是下一代AI的一个代表，智能呈指数级增长。

关键观点总结

关键观点1: 全新测试模型Gemini 2.0 Flash Thinking的推出

该模型基于2.0 Flash版本，使用慢思维思考方式，可深度展示思维链过程。

关键观点2: Thinking模型支持多模态推理

能够处理复杂的数学、编程问题，并展示出全部的推理过程。它在多个基准测试中排名第一。

关键观点3: 谷歌与OpenAI的竞争

谷歌和OpenAI在AI领域的竞争愈发激烈，而Thinking模型是谷歌在AI领域的重要进展。

关键观点4: Thinking模型的开放使用

目前，Thinking模型已经开放使用，用户可以在Google AI Studio 和 Vertex AI 中的 Gemini API中尝试。

文章预览

今天凌晨1点，谷歌DeepMind首席科学家宣布推出全新测试模型——Gemini 2.0 Flash Thinking。新的Thinking模型是以刚发布的2.0 Flash版本为基础，使用了类似o1模型的慢思维思考方式，可以深度可视化展示整个思维链过程，尤其是在执行数学、编程等复杂问题方面，能持续输出全部推理过程，而不是直接给出答案。值得一提的是，Thinking是支持多模态推理的。例如，让Thinking模型解读一道非常复杂的物理题：一个电子被困在一维无限势阱中，其边界位于\(x = -0.15 \) nm 和 \( x = +0.15 \) nm。求当电子在势阱中改变能级时发射出的四个最长波长的光子。 Thinking 可以完完整整地展现出所有的推理过程。也可以让Thinking推理一下图片：如何使用这些数字中的三个，使其相加总和为 30 呢？根据Chatbot Arena LLM Leaderboard最新评测数据显示，Thinking模型在代码、数学、指令遵循 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博