专栏名称: GIS研发
GIS研发团队,聚焦科技创新、软件研发及优秀人才培养,攻克视频GIS、GeoAI、GIS开发及应用领域的关键技术问题。
今天看啥  ›  专栏  ›  GIS研发

TGRS | RingMoGPT: 空天院团队提出统一的视觉-语言遥感基础模型, 六大任务表现出色

GIS研发  · 公众号  ·  · 2024-12-12 18:09
    

文章预览

转自: 遥感与深度学习 题目 :RingMoGPT: A Unified Remote Sensing Foundation Model for Vision, Language, and grounded tasks 期刊:IEEE Transactions on Geoscience and Remote Sensing 论文:https://ieeexplore.ieee.org/abstract/document/10777289 年份:2024 单位:中科院空天院、中科院自动化所、中国科学院大学 创新点 多模态统一模型:RingMoGPT结合视觉、语言和地理定位能力,能够处理场景分类、目标检测、视觉问答、图像字幕生成及变化检测等六个主要任务。 数据集构建: 构建了一个包含52万对高质量图像-文本配对的数据集,细化了远程感知图像的对象描述。 构建了160万对包含指令调优的多任务数据集,支持多时态场景分析。 模块设计: 提出了带有地理位置和指令感知能力的Q-Former模块,提升定位和多时态分析性能。 集成了变化检测模块,实现图像变化的精准分析。 数据 数据集 数据主 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览