讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
目录
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

RoboAgent:通过语义增强和动作分块实现机器人操作的泛化和效率

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-08-30 00:15

文章预览

23年9月来自CMU和Meta FAIR的论文“RoboAgent: Generalization and Efficiency in Robot Manipulation via Semantic Augmentations and Action Chunking”。 拥有一个可以在不同环境中操纵任意目标的机器人这一宏伟目标,与机器人数据集的匮乏相矛盾。由于人工、运营成本和安全挑战,获取和扩大此类数据集非常困难。实现这种通用智体的途径,需要一个能够广泛推广但训练数据预算合理的结构化框架。本文开发了一个高效的系统 (RoboAgent),采用 (a) 可以快速扩大现有数据集的语义增强,和 (b) 动作表示,其通过小而多样化的多模态数据集提取高性能策略而不会过拟合,训练具有多任务操纵技能的通用智体。此外,可靠的任务调节和富有表现的策略架构,使智体能够在语言命令指定的新情况下展示多样化的技能。 该系统仅使用 7500 次演示,就能训练一个能够掌握 12 种独特技能的单 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览