基于情境依赖因果影响的多智能体协作强化学习

AI大模型学习基地 · 公众号 · · 2024-10-14 10:54

文章预览

文章介绍了一种新的多智能体强化学习（ MARL ）算法，名为情境依赖因果影响多智能体协作强化学习（ SCIC ），其目的是为了提升智能体间的协作能力和探索能力。该算法通过分析多智能体环境中智能体之间的因果影响，在特定情境下利用因果干预和条件互信息来识别智能体行为对其他智能体产生的影响。这种方法有助于智能体发现那些能对其它智能体产生正面效果的状态，进而促进智能体间的合作。实验结果表明， SCIC 在多种 MARL 基准测试中表现优越。文章还探讨了未来将 SCIC 扩展到去中心化训练及模型化 MARL 算法的可能性。 1 情境依赖因果影响多智能体协作强化学习情境依赖因果影响多智能体协作强化学习( Causal Influence-Based Cooperative Multi-agent Reinforcement Learning ： SCIC ) 采用一种新的协作准则，通过度量智能体之间的情境依赖因果影响来构建内 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

纪念币预约信息 · 火爆！京剧旦角纪念币，首日兑换结果公布！

昨天

纪念币预约信息 · 开始预约！2025蛇年百福金钞！权威发行！

昨天

小易说钱 · 旦角币仅1个版本？这样的，报价8000！

昨天

纪念币预约信息 · 开始兑换！京剧旦角纪念币！超漂亮！

2 天前

纪念币预约信息 · 京剧旦角纪念币开始兑换，查询入口公布！

3 天前

安然的数学小酒馆 · 八月底了，阿里数学竞赛的决赛成绩什么时候出？

2 月前

深圳大件事 · 广东省人大教科文卫委原主任委员梁万里被查

1 月前

中国出口信用保险公司 · 服务贸易承保取得新突破 ——信用保险助力光伏产品检验检测服务出海

4 周前