今天看啥  ›  专栏  ›  灵度智能

ECCV2024 | 阿里&中科院提出街景定位大模型AddressCLIP:一张图实现街道级精度定位!

灵度智能  · 公众号  ·  · 2024-09-25 12:27
    

文章预览

中科院自动化所和阿里云一起推出了街景定位大模型AddressCLIP,只要一张照片就能实现街道级精度的定位。 比如给模型看一张北京南锣鼓巷的街景之后,它直接给出了具体的拍摄位置,并列举了附近的多个候选地址。 基于图像的地理定位和地址定位任务的比较。所提出的任务的目标是预测给定图像的语义文本地址,而不是数字 GPS 坐标,而无需检索库。 相关链接 论文地址:https://arxiv.org/abs/2407.08156 项目主页:https://addressclip.github.io GitHub:https://github.com/xsx1001/AddressCLIP 论文阅读 AddressCLIP:为城市范围内的图像地址定位提供视觉语言模型 摘要 论文介绍了社交媒体和新闻摄影提出的一个新问题,即图像地址定位 (IAL),旨在预测拍摄图像的可读文本地址。现有的两阶段方法涉及预测地理坐标并将其转换为人类可读的地址,这可能会导致歧义并耗费大 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览