RoboUniview ：视觉语言大模型控制机器人新SOTA！突破机器人相机限制！

CVer · 公众号 · · 2024-06-29 23:59

文章预览

点击下方卡片，关注“ CVer ”公众号 AI/CV重磅干货，第一时间送达点击进入—> 【Mamba/多模态/扩散】交流群添加微信：CVer5555，小助手会拉你进群！扫描下方二维码，加入CVer学术星球！可以获得最新顶会/顶刊上的论文idea 和 CV从入门到精通资料，及最前沿应用！发论文/搞科研/涨薪，强烈推荐！ RoboUniview ：视觉语言大模型控制机器人新SOTA，突破机器人相机限制，更好的理解物理世界，为一个模型部署不同机器人本体提供可行方法。项目主页： Visual-Language Model with Unified View Representation for Robotic Manipulaiton 代码： github.com/liufanfanlff/RoboUniview 论文： https://arxiv.org/pdf/2406.18977 利用视觉语言模型（VLMs）进行机器人操控是一种新的范式，旨在增强模型对新物体和指令的泛化能力。然而，由于摄像头规格和安装位置的变化，现有方法在不同的机器人平台 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博