今日arXiv最热大模型论文：港大 & 微软发布AgentGen提高大模型规划能力，8B模型接近GPT-4水平

夕小瑶科技说 · 公众号 · 科技自媒体 · 2024-08-28 12:54

主要观点总结

文章介绍了港大与微软联合提出的AgentGen框架，该框架能够自动生成多样化的环境和任务，用于提升基于大语言模型（LLM）的Agent的规划能力。通过指令微调LLMs来提升规划能力，AgentGen在多个领域内和领域外的规划任务上取得了显著成果，甚至在某些任务上超越了GPT-4的表现。

关键观点总结

关键观点1: AgentGen框架的提出背景和重要性

鉴于目前Agent训练主要集中在手动设计的规划任务和环境中的合成轨迹，港大和微软提出了AgentGen框架，旨在自动合成多样化环境和渐进规划任务，提高LLM的规划能力。

关键观点2: AgentGen框架的关键组成部分

AgentGen框架包括两个核心组成部分：环境生成和任务生成。环境生成涉及使用LLM生成环境规范、环境实现和构建环境库。任务生成则基于生成的环境，使用LLM生成相应的规划任务，并采用BI-EVOL两阶段生成方法进行难度调节。

关键观点3: AgentGen框架的实验验证

为评估AgentGen框架的有效性，进行了一系列实验，包括领域内任务评估和领域外任务评估。实验结果显示，AgentGen在多个任务上取得了显著成果，某些情况下甚至超越了GPT-4的表现。

关键观点4: AgentGen框架的应用前景

AgentGen框架在提升模型的规划能力方面表现出色，未来可能被应用到更复杂的规划任务中，如机器人控制、智能家居系统以及日常生活中的实际应用，如协助个人日程安排或优化交通路线规划。

文章预览

夕小瑶科技说原创作者 | Richard 在大语言模型（LLM）问世之后，基于 LLM 的 Agent 引起了广泛的关注并且变得越来越流行。规划能力无论对人类还是 Agent 都是一个重要的决策步骤，规划的本质是通过预先设定的行动过程，以期望在未来达到特定的目标或者解决特定的问题。规划是基于 LLM 的 Agent 一个关键的能力，涉及从初始状态达到预期目标的系统性过程。规划决定了 Agent 如何在复杂环境中自主操作，其中包括与环境交互、执行动作、考虑约束条件和可用资源等。最近关于 Agent 训练的最新研究表明，通过使用轨迹数据（动作-观察对）序列对大模型进行微调可以增强其规划的能力。但是目前的工作主要集中于手动设计的规划任务和环境中的合成轨迹。鉴于此，港大联合微软提出 AgentGen 框架，对自动合成多样化环境和从简单到困难的渐进规 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博