专栏名称: 极客公园
科技创新者的大本营。汇聚优秀的产品报道、评测视频和高质量的线下活动。
今天看啥  ›  专栏  ›  极客公园

Google 深夜狙击 OpenAI:新 Agent 功能可以自己打开浏览器查资料了

极客公园  · 公众号  · 科技媒体  · 2024-12-12 02:41
    

主要观点总结

文章介绍了Google和OpenAI在AI领域的最新进展,尤其是Google的新模型Gemini 2.0以及相关的Agent功能。文章还讨论了Agent技术的发展挑战和可能带来的变革,以及它对未来的影响。

关键观点总结

关键观点1: Google发布新模型Gemini 2.0,建立了在新模型能力之上的多个Agent功能,包括Project Astra、Project Mariner、Jules和游戏Agent。

这些功能分别涉及在Google应用、Chrome浏览器、编程和游戏中使用AI来辅助用户完成任务。其中,Gemini 2.0具有原生多模态能力,包括图像生成、音频输出和原生工具应用能力。

关键观点2: Agent技术的发展和应用。

Agent功能具有自动完成任务的能力,能提升工作效率和使用体验。目前,Google的Agent技术在搜索、游戏、编程等领域有了应用,并且正在探索将Agent技术应用于现实世界中的机器人和虚拟世界。但Agent技术还面临诸多挑战,如隐私保护、误操作的安全隐患等。

关键观点3: Gemini 2.0 Flash模型的推出。

这是Google大号模型蒸馏而来的小号模型,具有高级推理和长上下文能力,支持多模态输入和输出。它还可以原生调用Google Search、代码执行以及第三方用户定义的函数等工具。

关键观点4: Google对未来Agent时代的展望。

随着AI技术的发展,Google认为未来将是Agent的时代。Agent能力的提升为新的智能硬件真正进入人们生活打下了基础,例如通过语音指令,眼镜能直接自动完成部分任务。不过,仍需要解决一系列挑战,如隐私保护、安全性等。


文章预览

甚至还可以 实 时在线教 你打游戏了 。 作者 | Li Yuan 2024 年走到年底,似乎 AI 大厂们集体又决定搞点事情了。 在 OpenAI 宣布连发 12 天更新后,Google 选择 12 月 11 日深夜(在 OpenAI 发布更新之前),发布新模型 Gemini 2.0。 在多次发布被 OpenAI 精准狙击后,Google 今夜扳回一局,发布了 Gemini 2.0,直指 Agent 使用,一个 OpenAI 至今没有明确公开布局的领域——之前有消息称,OpenAI 将在明年推出使用电脑的 Agent。 Agent 功能,也称为智能体功能,通常指的是 AI 能够感知环境、执行任务并在一定程度上独立做出决策的能力,也就是能更自动化完成任务的功能。 此次 Google 似乎赌对了。OpenAI 凌晨两点的发布,主要宣布了和 Apple Intelligence 的合作,一个普遍被期待能与 Agent 能力强相关的合作。不过今夜最终的发布,主要仍然集中于文字生成和视觉智能方面,并没有 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览