发布清华大学法学院、清华大学智能法治研究院在“计算法学”(Computational Law)前沿领域的活动信息与研究成果。
今天看啥  ›  专栏  ›  清华大学智能法治研究院

斯坦福李飞飞: 《AI Agent:多模态交互前沿调查》 论文全文翻译

清华大学智能法治研究院  · 公众号  ·  · 2024-11-22 20:13
    

文章预览

多模态AI系统很可能会在我们的日常生活中无处不在。将这些系统具身化为物理和虚拟环境中的代理是一种有前途的方式,以使其更加互动化。目前,这些系统利用现有的基础模型作为构建具身代理的基本构件。将代理嵌入这样的环境中,有助于模型处理和解释视觉和上下文数据的能力,这是创建更复杂且具备上下文感知的AI系统的关键。例如,一个能够感知用户动作、人类行为、环境对象、音频表达以及场景整体情绪的系统,可以用于指导代理在特定环境中的响应行为。 图1:Agent AI系统的概述,该系统可以在不同领域和应用中进行感知和行动。Agent AI正逐渐成为迈向通用人工智能(AGI)的一条有前景的途径。Agent AI的训练展示了其在物理世界中实现多模态理解的能力。通过利用生成式AI和多个独立的数据源,该系统提供了一个与现实无关的训练框 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览