今天看啥  ›  专栏  ›  深蓝AI

攻克自动驾驶长距离行为动作学习,解码ICML24 Spotlight的VQ-BeT

深蓝AI  · 公众号  ·  · 2024-08-31 10:00

文章预览

导读: 作者提出了一种名为VQ-BeT的模型,该模型通过残差VQ-VAE对动作空间进行标记,并使用变换器模型预测动作标记,在操纵、运动和自动驾驶任务中表现良好。VQ-BeT的一个潜在应用是扩展到更大规模的数据、环境和行为模式的数据集,发现不同实施例之间的共享动作潜在空间,可能实现不同机器人之间甚至从人类到机器人的策略“翻译”, ‍ 并加快现实世界中的强化学习应用程序。 ©️【深蓝AI】编译 如何从标注数据集生成复杂行为的生成模型一直是预测决策领域的一个挑战。与语言或图像生成不同,决策需要对动作进行建模————构建连续值向量,这些向量在分布上是多模态的,可能来自未经整理的数据源,其中生成错误可能混合在顺序预测中。最近一类称为行为Transformers (BeT)的模型通过使用k均值聚类来离散化动作以捕获不同的模式来解 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览