讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

RH20T:用于单样本学习多种技能的综合机器人数据集

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-09-19 00:23
    

文章预览

23年7月来自上海交大的论文“RH20T: A Comprehensive Robotic Dataset for Learning Diverse Skills in One-Shot”。 开放领域机器人操作面临的一个关键挑战,是如何让机器人获得多样化和可泛化的技能。单样本模仿学习和机器人基础模型的最新进展,显示出将训练的策略迁移到基于演示新任务的前景。这一特性对于使机器人获得新技能并提高其操作能力很有吸引力。然而,由于训练数据集的限制,社区目前的重点主要放在简单的情况上,例如推或取-放任务,仅依靠视觉引导。事实上,有许多复杂的技能,其中一些甚至可能需要视觉和触觉感知才能解决。本文旨在释放智体通过多模态感知泛化到数百种现实世界技能的潜力。为了实现这一目标,收集一个数据集,其中包含超过 110,000 个接触丰富的机器人操作序列,涵盖各种技能、环境、机器人和摄像机视点,所有这些 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览