讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

通过观看学习:基于视频机器人操作的学习方法综述

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-09-05 00:07

文章预览

24年2月来自Oklahoma州立大学的论文“Learning by Watching: A Review of Video-based Learning Approaches for Robot Manipulation”。 多样化、无偏见的数据集稀缺,阻碍了机器人学习操作技能。虽然精选的数据集可以有所帮助,但在普遍性和现实世界迁移方面仍然存在挑战。同时,大规模的“野外”视频数据集,通过自监督技术推动了计算机视觉的进步。最近的研究将其转到机器人技术方面,探索了通过被动观看大量在线视频来学习操作技能。这种基于视频的学习范式,显示出有希望的结果,它们提供了可扩展的监督,同时减少了数据集偏差。 本综述回顾视频特征表示学习技术、目标affordance理解、3D 手/身体建模和大规模机器人资源等基础,以及从不受控制的视频演示中获取机器人操作技能的新兴技术。讨论仅通过观察大规模人类视频来学习如何提高机器人操作的泛化性 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览