讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

【LLM】AgentGym:具有自我演化能力的通用LLM agent

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-06-30 03:36
    

文章预览

一、结论写在前面 论文来自复旦自然语言处理实验室 & 复旦视觉与学习实验室 论文首次尝试构建具有自我演化能力的通用LLM基础agent。论文确定了三个关键要素:1)多样化的环境供agent探索学习;2)一套轨迹集赋予agent基本能力和先验知识;3)一种有效且可扩展的演化方法。 论文提出了AGENTGYM框架,一个包含多样化环境、任务和目标的交互平台,专为LLM基础agent设计。AGENTGYM通过HTTP服务提供便捷的API,标准化任务规范、环境设置以及agent的观测/动作空间。在此平台上,论文实现了一个统一的多轮交互和实时反馈接口,跨越不同环境,以支持在线评估、轨迹采样和交互训练。 具体而言,它包含14种agent环境、89种任务,涵盖网络任务、具身任务及更多,并具有高度灵活性以扩展至更多类型。同时,论文提出了一种新算法AGENTEVOL,用于探索基于大型语 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览