文章预览
导语 大语言模型遭遇囚徒困境时,会如何决策?目前人工智能在面对复杂决策,特别是涉及到与其他智能体的互动时,依然存在很大的局限性。即使是最先进的大型语言模型(LLM)在处理这些博弈时也面临着计算纳什均衡的挑战,在面对不确定性和噪声时仍存在鲁棒性问题。 如何创建一个理性的基于LLM的智能体?能否通过创新的算法工作流来提高智能体的谈判能力和资源分配效率?针对这些问题,分享嘉宾提出了基于博弈论的工作流:将博弈论作为基础,以理性和帕累托最优性作为两大基本评估指标——即个体是否理性,以及是否基于个体理性得出全局最优解——旨在观察并提升智能体在以自我利益最大化为指导的交互中的表现。 本周日上午10点, 大语言模型与多智能体系统 带来社区福利:来自罗格斯大学的华文越将分享她的最新研究成果,谈
………………………………