专栏名称: Datawhale
一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。
今天看啥  ›  专栏  ›  Datawhale

打王者荣耀,发NeurIPS!

Datawhale  · 公众号  ·  · 2025-03-22 22:56
    

文章预览

 Datawhale学术  数据集:多智能体,编辑: 学姐带你玩AI 论文题目:Hokoff:Real Game Dataset from Honor of Kings and its Offline Reinforcement Learning Benchmarks 论文地址:https://arxiv.org/pdf/2408.10556 创新点 提出了 Hokoff 数据集,这是首个基于《王者荣耀》的离线强化学习(Offline RL)和离线多智能体强化学习(Offline MARL)基准数据集。该数据集涵盖了单智能体(1v1)和多智能体(3v3)场景,能够模拟真实世界的复杂决策环境,填补了现有离线 RL 数据集在复杂任务和多智能体场景中的空白。 提供了一个开源的、易于使用的离线强化学习框架,支持数据采样、模型训练和性能评估的全流程。该框架不仅支持多种离线 RL 和离线 MARL 算法的实现,还提供了丰富的工具和 API,方便研究人员开发新的算法或网络架构。 提出了一种新的基线算法 QMIX+CQL,将多智能体强化学习中的 QM ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览