专栏名称: 深蓝AI
专注于人工智能在线教育
今天看啥  ›  专栏  ›  深蓝AI

吴家俊团队新作:探索LLM在具身决策制定中的角色

深蓝AI  · 公众号  ·  · 2024-11-13 18:24

文章预览

‍ 论文追踪与交流👇,每周分享最新动态 引言 在人工智能的快速发展中,LLMs已成为构建具身决策制定代理的强大工具。 这些代理不仅需要理解自然语言指令,还需在数字和物理环境中通过一系列动作实现指定目标。 尽管LLMs在决策制定中的潜力巨大,但我们对其在具身环境中的全面能力和局限性的理解仍然有限。 现有的评估方法由于缺乏标准化的任务、模块和细粒度评估指标,往往无法提供深入的洞察。 近日,由斯坦福大学吴家俊团队提出的EMBODIED AGENT INTERFACE(EAI)框架,这项工作被NIPS 2024接收为oral。 该框架专注于评估LLMs在具身决策制定中的表现,旨在通过标准化的方法全面评估LLMs的性能。 论文题目:Embodied Agent Interface: Benchmarking LLMs for Embodied Decision Making 论文作者:Manling Li , Shiyu Zhao , Qineng Wang, et al. 1 具身决策制定的挑战 在具身决策制 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览