文章预览
“ 问 渠 那 得 清 如 许 , 为 有 源 头 活 水 来 ” , 通 过 前 沿 领 域 知 识 的 学 习 , 从 其 他 研 究 领 域 得 到 启 发 , 对 研 究 问 题 的 本 质 有 更 清 晰 的 认 识 和 理 解 , 是 自 我 提 高 的 不 竭 源 泉 。 为 此 , 我 们 特 别 精 选 论 文 阅 读 笔 记 , 开 辟 “ 源 头 活 水 ” 专 栏 , 帮 助 你 广 泛 而 深 入 的 阅 读 科 研 文 献 , 敬 请 关 注! 空间大模型SpatialBot:作为对李飞飞老师空间智能 (Spatial Intelligence)的思考 上交,斯坦福,智源,北大,牛津,东大: 论文标题: SpatialBot: Precise Depth Understanding with Vision Language Models 论文: https://arxiv.org/abs/2406.13642 主页: github.com/BAAI-DCAI/SpatialBot 如何让大模型(MLLM, VLM)理解空间? 作者认为, RGB+Depth可以作为大模型理解空间的途径,但是: 1. 现有模型无法直接理解深度图输入 2. 现有大模型数据集
………………………………