专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

本文提出了一种基于状态级安全约束和受控不变集的多智能体强化学习框-20241126054420

爱可可-爱生活  · 微博  · AI  · 2024-11-26 05:44
    

文章预览

2024-11-26 05:44 本条微博链接 本文提出了一种基于状态级安全约束和受控不变集的多智能体强化学习框架及MADAC算法,该算法保证收敛到广义纳什均衡,并在实验中显著优于现有安全MARL算法,实现了奖励最大化和安全约束的最佳平衡。 [LG]《Safe Multi-Agent Reinforcement Learning with Convergence to Generalized Nash Equilibrium》Z Li ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览