今天看啥  ›  专栏  ›  腾讯科技

谷歌发布新一代大模型Gemini 2.0,掀了AI圈牌桌,全力狙击OpenAI

腾讯科技  · 公众号  · 科技媒体  · 2024-12-12 09:55
    

主要观点总结

谷歌发布了新一代大模型Gemini 2.0,具备速度翻倍、能力更强、支持多模态输出等特点。通过多模态实时API和三个智能体研究原型展现了其潜力。谷歌在硬件层面也有重大投入,新一代TPU芯片Trillium支持了Gemini 2.0的全部训练和推理过程,并面向客户开放。谷歌的AI发展进入了新阶段,旨在确保在AI领域的领先地位,同时带来商业价值。

关键观点总结

关键观点1: Gemini 2.0的特点和优势

包括速度翻倍、能力更强、支持原生图像生成和音频输出的多模态输出、使用Google搜索和地图等工具的能力等。

关键观点2: 谷歌的新功能和应用场景

通过多模态实时API支持实时音频、视频流输入和多个组合工具的使用;通过三个智能体研究原型展示了系统级智能体的潜力,包括Project Astra、Project Mariner和Jules等。

关键观点3: 谷歌在硬件层面的投入

新一代TPU芯片Trillium支持了Gemini 2.0的训练和推理,并面向客户开放。Trillium在性能、训练大型语言模型的能力、成本效益等方面都有显著提升。

关键观点4: 商业意义

谷歌通过更新可能带来商业版图的漂移,包括在搜索和广告领域的优势、投资者对AI领域投入的回报率的提高、以及更远大的通用数字助手的愿景。


文章预览

AI未来指北特约作者 郝博阳 编辑 郑可君 丨 划重点 ①   谷歌发布了新一代大模型Gemini 2.0,速度翻倍,能力更强,支持原生图像生成和音频输出的多模态输出。 ②  谷歌推出新的多模态实时API,支持实时音频、视频流输入和多个组合工具的使用。 此外,还展示了三个智能体研究原型: Project Astra、Project Mariner和Jules。 ③  谷歌Gemini 2.0的发布是对固有业务的防御,以期在更低成本下实现更强大的能力所带来的投资回报率提升。 谷歌用一次发布,干了比OpenAI 五天都多的事儿。 12月12日凌晨,就在OpenAI轰轰烈烈的“12天连续发布”进行到第五天时,谷歌发布了他们的重磅更新—— Gemini 2.0 Flash。 它的速度翻倍,能力更强,且支持原生图像生成和音频输出的多模态输出,以及原生使用 Google 搜索和地图等工具。 这些更新,让谷歌带来的远不止是一个升级 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览