专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

WizardLM新作！AgentGen：通过环境和任务生成增强基于大模型的Agent规划能力

PaperWeekly · 公众号 · 科研 · 2024-12-24 18:17

文章预览

基于大语言模型的智能体（LLM-based Agent）受到了广泛关注，并越来越受欢迎。此外，规划能力是 LLM-based Agent 的重要组成部分，它涉及与环境的交互和执行行动以完成规划任务，这通常需要从初始状态实现预期目标。本文研究通过 Instruction Tuning（即 Agent Training）来提高 LLM-based Agent 的规划能力。最近关于 Agent Training 的研究表明，利用专家级轨迹数据（行动-观察对序列）对 LLM 进行 instruction tuning，可有效增强其规划能力。不过，现有的工作主要集中在从人工设计的规划任务和环境中合成轨迹。创建这些环境和任务需要耗费大量人力物力，因此无法生成足够丰富和广泛的轨迹用于智能体（Agent）训练。为了解决这一局限性，本文探索了自动合成各种环境和从易到难的渐进式规划任务的方法。作者引入了一个名为 AgentGen 的框架，该框架首先利用 LLM 生 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博