文章预览
点击下方 卡片 ,关注“ CVer ”公众号 AI/CV重磅干货,第一时间送达 点击进入—> 【Mamba/多模态/扩散】交流群 添加微信:CVer5555,小助手会拉你进群! 扫描下方二维码,加入CVer学术星球 ! 可以获得最新顶会/顶刊上的论文idea 和 CV从入门到精通资料,及最前沿应用 !发论文/搞科研/涨薪,强烈推荐! RoboUniview :视觉语言大模型控制机器人新SOTA,突破机器人相机限制,更好的理解物理世界,为一个模型部署不同机器人本体提供可行方法。 项目主页: Visual-Language Model with Unified View Representation for Robotic Manipulaiton 代码: github.com/liufanfanlff/RoboUniview 论文: https://arxiv.org/pdf/2406.18977 利用视觉语言模型(VLMs)进行机器人操控是一种新的范式,旨在增强模型对新物体和指令的泛化能力。然而,由于摄像头规格和安装位置的变化,现有方法在不同的机器人平台
………………………………