谷歌发布新一代大模型Gemini 2.0，掀了AI圈牌桌，全力狙击OpenAI

腾讯科技 · 公众号 · 科技媒体 · 2024-12-12 09:55

主要观点总结

谷歌发布了新一代大模型Gemini 2.0，具备速度翻倍、能力更强、支持多模态输出等特点。通过多模态实时API和三个智能体研究原型展现了其潜力。谷歌在硬件层面也有重大投入，新一代TPU芯片Trillium支持了Gemini 2.0的全部训练和推理过程，并面向客户开放。谷歌的AI发展进入了新阶段，旨在确保在AI领域的领先地位，同时带来商业价值。

关键观点总结

关键观点1: Gemini 2.0的特点和优势

包括速度翻倍、能力更强、支持原生图像生成和音频输出的多模态输出、使用Google搜索和地图等工具的能力等。

关键观点2: 谷歌的新功能和应用场景

通过多模态实时API支持实时音频、视频流输入和多个组合工具的使用；通过三个智能体研究原型展示了系统级智能体的潜力，包括Project Astra、Project Mariner和Jules等。

关键观点3: 谷歌在硬件层面的投入

新一代TPU芯片Trillium支持了Gemini 2.0的训练和推理，并面向客户开放。Trillium在性能、训练大型语言模型的能力、成本效益等方面都有显著提升。

关键观点4: 商业意义

谷歌通过更新可能带来商业版图的漂移，包括在搜索和广告领域的优势、投资者对AI领域投入的回报率的提高、以及更远大的通用数字助手的愿景。

文章预览

AI未来指北特约作者郝博阳编辑郑可君丨划重点 ① 谷歌发布了新一代大模型Gemini 2.0，速度翻倍，能力更强，支持原生图像生成和音频输出的多模态输出。 ② 谷歌推出新的多模态实时API，支持实时音频、视频流输入和多个组合工具的使用。此外，还展示了三个智能体研究原型： Project Astra、Project Mariner和Jules。 ③ 谷歌Gemini 2.0的发布是对固有业务的防御，以期在更低成本下实现更强大的能力所带来的投资回报率提升。谷歌用一次发布，干了比OpenAI 五天都多的事儿。 12月12日凌晨，就在OpenAI轰轰烈烈的“12天连续发布”进行到第五天时，谷歌发布了他们的重磅更新—— Gemini 2.0 Flash。它的速度翻倍，能力更强，且支持原生图像生成和音频输出的多模态输出，以及原生使用 Google 搜索和地图等工具。这些更新，让谷歌带来的远不止是一个升级 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博