一个从大三就接触NLP的小小NLPer,本公众号每天记录自己的一点一滴,每篇文章最后也有托福单词等新知识,学技术同时,也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇!
今天看啥  ›  专栏  ›  深度学习自然语言处理

如何创建一个理性的基于LLM的Agent?

深度学习自然语言处理  · 公众号  ·  · 2025-01-15 17:58
    

文章预览

主题 如何创建一个理性的基于LLM的智能体?使用博弈论工作流!   时间 北京时间 2025.1.19 10:30-11:30 周日 ‍ ‍ ‍ 引言 论文 :Game-theoretic LLM: Agent Workflow for Negotiation Games 链接 :https://arxiv.org/pdf/2411.05990 本文旨在观察并提升智能体在以自我利益最大化为指导的交互中的表现。 我们选择了博弈论作为基础,以理性和帕累托最优性作为两大基本评估指标:即个体是否理性,以及是否基于个体理性得出全局最优解。 完全信息博弈 这些是经典博弈,例如囚徒困境。我们选择了5个同时博弈和5个顺序博弈进行研究。研究发现,除了o1以外,其余LLM普遍缺乏计算纳什均衡的强大能力,也就是说,它们的理性水平较低。此外,它们对噪声、扰动或随机对话缺乏鲁棒性。 因此,基于经典博弈论方法(例如逐步消除占优策略和逆向归纳法),我们设计了两个工作流 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览