专栏名称: TsinghuaNLP
清华大学自然语言处理与社会人文计算实验室,是中国中文信息学会计算语言专业委员会和中国人工智能学会不确定性专业委员会的挂靠单位。负责人为清华大学计算机科学与技术系孙茂松教授,核心骨干为刘洋副教授,刘知远助理教授。
今天看啥  ›  专栏  ›  TsinghuaNLP

成果|多智能体经验迭代精炼框架——实现多智能体经验动态积累以增强任务解决能力

TsinghuaNLP  · 公众号  ·  · 2024-06-03 17:07
    

文章预览

随着大模型和智能体的发展,最近的一个重大突破是使智能体从先前的任务中积累经验。 代表性方法通过对历史任务重演,从中提取经验并进行记忆,以此在未见任务中通过经验样本检索来高效解决任务。 这些智能体通过积累经验,有效避免了重复错误和不必要的试错过程,减少了额外人工参与的需要。 然而,现有技术的经验往往是使用启发式规则一次性生成的。 这种方法限制了智能体动态适应软件开发等复杂任务的能力,同时存在部分经验质量不高,不能显著提升智能体完成任务的能力。 针对该问题,我组研究人员提出了 经验迭代精炼 ( I terative E xperience R efinement ) 框架 。该方法使智能体能够通过在不同批次的任务集上 持续地获取、利用和淘汰经验 来不断 适应未见任务 ,且仅利用 11.54% 的经验子集实现 更好的任务解决能力 。 论文信 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览