专栏名称: AI大模型学习基地
人工智能AIGC行业探索分享,包括相关技术分享和资讯分享,以及相关商务洽谈合作。
今天看啥  ›  专栏  ›  AI大模型学习基地

基于情境依赖因果影响的多智能体协作强化学习

AI大模型学习基地  · 公众号  ·  · 2024-10-14 10:54

文章预览

文章介绍了一种新的多智能体强化学习( MARL )算法,名为情境依赖因果影响多智能体协作强化学习( SCIC ),其目的是为了提升智能体间的协作能力和探索能力。该算法通过分析多智能体环境中智能体之间的因果影响,在特定情境下利用因果干预和条件互信息来识别智能体行为对其他智能体产生的影响。这种方法有助于智能体发现那些能对其它智能体产生正面效果的状态,进而促进智能体间的合作。实验结果表明, SCIC 在多种 MARL 基准测试中表现优越。文章还探讨了未来将 SCIC 扩展到去中心化训练及模型化 MARL 算法的可能性。 1 情境依赖因果影响多智能体协作强化学习 情境依赖因果影响多智能体协作强化学习( Causal Influence-Based Cooperative Multi-agent Reinforcement Learning : SCIC ) 采用一种新的协作准则,通过度量智能体之间的情境依赖因果影响来构建内 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览