专栏名称: 深度学习自然语言处理

一个从大三就接触NLP的小小NLPer，本公众号每天记录自己的一点一滴，每篇文章最后也有托福单词等新知识，学技术同时，也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

如何创建一个理性的基于LLM的Agent？

深度学习自然语言处理 · 公众号 · · 2025-01-15 17:58

文章预览

主题如何创建一个理性的基于LLM的智能体？使用博弈论工作流！时间北京时间 2025.1.19 10:30-11:30 周日 ‍ ‍ ‍ 引言论文：Game-theoretic LLM: Agent Workflow for Negotiation Games 链接：https://arxiv.org/pdf/2411.05990 本文旨在观察并提升智能体在以自我利益最大化为指导的交互中的表现。我们选择了博弈论作为基础，以理性和帕累托最优性作为两大基本评估指标：即个体是否理性，以及是否基于个体理性得出全局最优解。完全信息博弈这些是经典博弈，例如囚徒困境。我们选择了5个同时博弈和5个顺序博弈进行研究。研究发现，除了o1以外，其余LLM普遍缺乏计算纳什均衡的强大能力，也就是说，它们的理性水平较低。此外，它们对噪声、扰动或随机对话缺乏鲁棒性。因此，基于经典博弈论方法（例如逐步消除占优策略和逆向归纳法），我们设计了两个工作流 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

鱼羊史记 · 1、人生三大桌：出生时摆一桌；结婚时摆一桌；死的时候摆一桌。第一桌你吃不了，第二桌你忙得顾不上，第三桌别人替你吃了。说白了，自己一桌都没捞着。所以啊，该吃吃该喝喝，别老为小事儿烦心，健....

昨天

夏天的陈小舒 · 这套书必入！用穿越故事带孩子亲历7朝！

3 天前

夏天的陈小舒 · 这套书必入！用穿越故事带孩子亲历7朝！

3 天前

安泰珂电子有限公司 · 相约安泰，珂以未来！

5 月前

风云侃股 · 操盘大师把“MACD”运用得出神入化，一旦掌握，出手就是涨停板！

2 月前