专栏名称: 3D视觉之心
3D视觉与SLAM、点云相关内容分享
今天看啥  ›  专栏  ›  3D视觉之心

LEO:多模态LLM能力升级,与3D世界交互更进一步!

3D视觉之心  · 公众号  ·  · 2024-09-04 07:00

文章预览

作者 | 具身智能之心  编辑 | 具身智能之心 点击下方 卡片 ,关注“ 3D视觉之心 ”公众号 第一时间获取 3D视觉干货 >> 点击进入→ 3D视觉之心技术交流群 论文题目:LEO: An Embodied Generalist Agent in 3D World 原文链接:https://arxiv.org/abs/2311.12871 项目地址:https://embodied-generalist.github.io/ 作者单位:北京通用人工智能研究院通用视觉实验室 在人工智能和神经科学领域,构建一个能够处理各种综合任务的通用模型一直是研究者们长期追求的目标。这种模型应该能够像人类一样,不仅在二维空间中表现出色,更能深入理解和交互于复杂的三维物理世界。然而,现有的通用模型在二维领域的成就虽然显著,但它们在三维空间的理解上却显得力不从心,这成为了它们在解决现实世界任务和接近人类智能水平时的一大障碍。为了克服这一限制,文章提出了一个核心问题 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览