注册
登录
专栏名称:
自动驾驶专栏
自动驾驶专栏,持续聚焦自动驾驶最新资讯,并且分享行业内相关技术研究。欢迎志同道合的伙伴关注,并参与交流或者分享。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
潇湘晨报
·
中国女子在日本买下70万平米小岛,最新回应: ...
·
17 小时前
潇湘晨报
·
小红书出现马斯克相关账号?特斯拉回应
·
昨天
株洲交通984
·
注意!未来10天,橙色预警!
·
昨天
潇湘晨报
·
突传消息!她怀孕了
·
2 天前
潇湘晨报
·
长沙一家长辅导孩子写作业,气到脑出血……
·
2 天前
今天看啥
›
专栏
›
自动驾驶专栏
【同济大学和加利福尼亚大学伯克利分校】用于多智能体强化学习中协同驾驶的语言驱动策略蒸馏
自动驾驶专栏
·
公众号
· · 2024-11-08 09:10
文章预览
点击下方 卡片 ,关注“ 自动驾驶专栏 ”公众号 自动驾驶干货 ,即可获取 论文链接: https://arxiv.org/pdf/2410.24152 摘要 本文介绍了用于多智能体强化学习中协同驾驶的语言驱动策略蒸馏。互联自动驾驶汽车(CAVs)的协同驾驶技术对于提高交通系统的效率和安全性是至关重要的。基于学习的方法(例如多智能体强化学习(MARL))在协同决策任务中展现出强大的能力。然而,现有的MARL方法在学习效率和性能方面仍然面临挑战。近年来,大型语言模型(LLMs)快速发展,在不同的顺序决策任务中展现出卓越的能力。为了提高协作智能体的学习能力同时确保决策效率和成本效益,本文提出了LDPD,这是一种语言驱动的策略蒸馏方法,用于引导MARL探索。在本框架中,基于LLM的教师智能体通过其决策演示来训练更小的学生智能体,以实现协同决策。教师智能体 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
潇湘晨报
·
中国女子在日本买下70万平米小岛,最新回应:目前没有私有化打算,今年将带员工去团建
17 小时前
潇湘晨报
·
小红书出现马斯克相关账号?特斯拉回应
昨天
株洲交通984
·
注意!未来10天,橙色预警!
昨天
潇湘晨报
·
突传消息!她怀孕了
2 天前
潇湘晨报
·
长沙一家长辅导孩子写作业,气到脑出血……
2 天前
古典音乐
·
莫扎特250周年诞辰纪念 | 穆特演绎莫扎特小提琴协奏曲全集
4 月前
电影截图录
·
为了八百块,她和朋友打赌,去向进来的第一个男人要皮带...鼓足勇-20241002051329
3 月前
储能与电力市场
·
阳光电源/中车株洲所预中标,76%报价≤0.5元/Wh,黄河水电青海800MWh储能系统中标候选公示
4 周前