文章预览
点击下方 卡片 ,关注 「3D视觉工坊」 公众号 选择 星标 ,干货第一时间送达 来源:计算机视觉工坊 0. 论文信息 标题:MambaPlace:Text-to-Point-Cloud Cross-Modal Place Recognition with Attention Mamba Mechanisms 作者:Tianyi Shang, Zhenyu Li, Wenhao Pei, Pengjie Xu, ZhaoJun Deng, Fanchen Kong 机构:Qilu University of Technology 原文链接:https://arxiv.org/abs/2408.15740 代码链接:https://github.com/nuozimiaowu/MambaPlace/tree/main 1. 摘要 视觉语言位置识别(VLVPR)通过结合来自图像的自然语言描述来增强机器人定位性能。VLVPR利用语言信息指导机器人位置匹配,克服了单纯依靠视觉的限制。多模态融合的本质在于挖掘不同模态之间的互补信息。然而,一般的融合方法依赖于传统的神经架构,并且不能很好地捕捉跨模态交互的动态,尤其是在存在复杂的模态内和模态间相关性的情况下。为此,本文提出了一种新的
………………………………