专栏名称: 将门创投

将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

IJCAI 2024 | 多智能体强化学习新范式：个性化训练与蒸馏执行

将门创投 · 公众号 · 科技创业 · 2024-06-06 08:22

文章预览

大家好，这里和大家分享一篇我们在多智能体强化学习（MARL）领域关于新的训练范式的文章（Accepted by IJCAI 2024）。这篇文章展示了如何通过个性化的集中式训练得到一个强大的集中式执行算法，然后通过知识蒸馏的方式使得智能体决策既受益于全局信息同时又能实现分散式执行，从而提升多智能体系统的协作性能。论文标题： PTDE: Personalized Training with Distilled Execution for Multi-Agent Reinforcement Learning 论文链接： https://arxiv.org/pdf/2210.08872 代码链接： https://github.com/AntNLP/nope_head_scale 一、研究背景与挑战在现实世界的许多任务中，如多机器人导航、避障、无人机路径规划等，都可以建模为多智能体系统的决策问题。这些场景通常受到局部可观测和分散式执行的约束。最常见的范式是集中式训练分散式执行（Centralized Training with Decentralized Execution, CTDE） ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

网信青海 · 青海首个“万兆小区”落户西宁

2 小时前

网信青海 · 青海首个“万兆小区”落户西宁

2 小时前

股妖姬 · 液冷服务器王者归来，核心公司名单

昨天

股妖姬 · 液冷服务器王者归来，核心公司名单

昨天

济南时报 · iPhone 16e发布后，MacBook、iPad等五款苹果新品也被曝出

2 天前

济南时报 · iPhone 16e发布后，MacBook、iPad等五款苹果新品也被曝出

2 天前

厦门广电 · 售价217万元！马斯克投资的飞行汽车试飞成功！垂直起降，无外露螺旋桨，只能坐两人，预计年底能交货

2 天前

厦门广电 · 售价217万元！马斯克投资的飞行汽车试飞成功！垂直起降，无外露螺旋桨，只能坐两人，预计年底能交货

2 天前

创乎 · 创业成本：时间与知识的核心作用

3 天前

欧陆思想联萌 · 有了它，人生易如反掌

8 月前

小胖看房 · 上海近期将上市新房项目官宣！天安1号认购50+、锦园20+、中海领邸190+、古美阅华200+、招商臻境110+！

6 月前

LearnAndRecord · 郑钦文无缘美网四强

5 月前

十堰晚报 · 下周起，十堰出租车价格临时调整

1 月前