专栏名称: AI TIME 论道
AI TIME是一群关注人工智能发展,并有思想情怀的青年学者创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,链接全球AI学者,以辩论的形式探讨人工智能领域的未来。
今天看啥  ›  专栏  ›  AI TIME 论道

ACL2024 | 让Agent学会自我进化,玩德州扑克心机尽显

AI TIME 论道  · 公众号  ·  · 2024-07-24 18:17

文章预览

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 基于大模型的Agent,已经成为了大型的博弈游戏的高级玩家,而且玩的还是德州扑克、21点这种非完美信息博弈。 来自浙江大学、中科院软件所等机构的研究人员提出了新的Agent进化策略,从而打造了一款会玩德州扑克的“狡猾”智能体Agent-Pro。 通过不断优化自我构建的世界模型和行为策略, Agent-Pro掌握了 虚张声势、主动放弃等人类高阶游戏策略。 Agent-Pro以大模型为基座,通过自我优化的Prompt来建模游戏世界模型和行为策略。 相比传统的Agent框架,Agent-Pro能够变通地应对复杂的动态的环境,而不是仅专注于特定任务。 而且,Agent-Pro还可以通过与环境互动来优化自己的行为,从而更好地达成人类设定的目标。 同时作者还指出,在竞争、公司谈判和安全等现实世界中遇到的情景,大多可以抽象为 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览