文章预览
论文标题:DyPS: Dynamic Parameter Sharing in Multi-Agent Reinforcement Learning for Spatio-Temporal Resource Allocation 作者:Jingwei Wang*, Qianyue Hao*, Wenzhen Huang, Xiaochen Fan, Zhentao Tang, Bin Wang, Jianye Hao, Yong Li 发表:KDD 2024 论文链接: https://doi.org/10.1145/3637528.3672052 代码链接: https://github.com/tsinghua-fib-lab/DyPS 导读 在城市的大规模资源分配场景中,根据资源和需求的时空分布,高效分配电力、医疗和交通等各种资源,对满足居民的生活需求至关重要。已有的资源分配研究主要采用多智能体强化学习(MARL)方法,通过多个智能体协作调配和分配资源以满足需求。然而,在城市中,由于智能体数量众多,现有的MARL方法计算复杂度高,缺乏高效的智能体参数共享策略。 现有方法在实现高效参数共享方面面临两大挑战:(1) 在RL训练过程中,智能体的行为发生显著变化
………………………………