RoboAgent：通过语义增强和动作分块实现机器人操作的泛化和效率

大语言模型和具身智体及自动驾驶 · 公众号 · · 2024-08-30 00:15

文章预览

23年9月来自CMU和Meta FAIR的论文“RoboAgent: Generalization and Efficiency in Robot Manipulation via Semantic Augmentations and Action Chunking”。拥有一个可以在不同环境中操纵任意目标的机器人这一宏伟目标，与机器人数据集的匮乏相矛盾。由于人工、运营成本和安全挑战，获取和扩大此类数据集非常困难。实现这种通用智体的途径，需要一个能够广泛推广但训练数据预算合理的结构化框架。本文开发了一个高效的系统 (RoboAgent)，采用 (a) 可以快速扩大现有数据集的语义增强，和 (b) 动作表示，其通过小而多样化的多模态数据集提取高性能策略而不会过拟合，训练具有多任务操纵技能的通用智体。此外，可靠的任务调节和富有表现的策略架构，使智体能够在语言命令指定的新情况下展示多样化的技能。该系统仅使用 7500 次演示，就能训练一个能够掌握 12 种独特技能的单 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博