讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

RoboTHOR:一个开放的模拟-到-现实具身智能平台

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-11-23 00:10
    

文章预览

20年4月 (CVPR'20) 来自AI2和华盛顿大学的论文“RoboTHOR: An Open Simulation-to-Real Embodied AI Platform”。 视觉识别生态系统(例如 ImageNet、Pascal、COCO)在现代计算机视觉的发展中发挥了不可否认的作用。在这些生态系统出现之前,交互式和具身视觉人工智能,已经达到了与视觉识别类似的发展阶段。最近,各种合成环境已被引入以促进具身智能的研究。尽管取得了这些进展,但在模拟中训练的模型如何很好地推广到现实这个关键问题仍然基本上没有答案。为模拟-到-现实的具身智能创建一个可比的生态系统,面临着许多挑战:(1)问题固有的交互性,(2)现实世界和模拟世界之间需要紧密结合,(3)复制可重复实验物理条件的难度,(4)以及相关成本。ROBOTHOR 使交互式和具身视觉智能的研究民主化。ROBOTHOR 提供一个框架,由模拟环境与物理环境配对,用于 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览