专栏名称: 3D视觉之心
3D视觉与SLAM、点云相关内容分享
今天看啥  ›  专栏  ›  3D视觉之心

街景定位大模型AddressCLIP:一张图实现街道级精度定位!

3D视觉之心  · 公众号  ·  · 2024-10-01 07:00

文章预览

作者 | AIGC Studio  编辑 | AIGC Studio 点击下方 卡片 ,关注“ 3D视觉之心 ”公众号 第一时间获取 3D视觉干货 >> 点击进入→ 3D视觉之心技术交流群 中科院自动化所和阿里云一起推出了街景定位大模型AddressCLIP,只要一张照片就能实现街道级精度的定位。 比如给模型看一张北京 南锣鼓巷 的街景之后,它直接给出了具体的拍摄位置,并列举了附近的多个候选地址。 基于图像的地理定位和地址定位任务的比较。所提出的任务的目标是预测给定图像的语义文本地址,而不是数字 GPS 坐标,而无需检索库。 相关链接 论文地址:https://arxiv.org/abs/2407.08156 项目主页:https://addressclip.github.io GitHub:https://github.com/xsx1001/AddressCLIP 论文阅读 AddressCLIP:为城市范围内的图像地址定位提供视觉语言模型 摘要 论文介绍了社交媒体和新闻摄影提出的一个新问题,即图像地 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览