多模态再度领跑CVPR！这18种创新SOTA方案必看

AI算法科研paper · 公众号 · · 2024-07-21 18:18

文章预览

从今年CVPR的热门主题上来看，多模态相关的论文依然很火，不少同学也私信来问了，我就火速整理了一部分来和你们分享。主要整理了6篇最新的多模态论文，还有10+篇经典的文章，论文包大家可以看这里领取！扫码添加小享，回复“ 多模态 ” 免费获取本次分享的全部论文看在这么高产的份儿上点个赞支持下叭~ CLIP-VG: Self-paced Curriculum Adapting of CLIP via Exploiting Pseudo-Language Labels for Visual Grounding 方法：作者提出了CLIP-VG，利用预训练模型CLIP和伪语言标签进行自定进度课程适应，实现无监督地理定位。另外，作者也设计了端到端网络，并提出单/多源课程适应算法。 MiniGPT4: Enhancing Vision-Language Understanding with Advanced Large Language Models 方法：作者提出MiniGPT-4，使用一个投影层将视觉编码器和语言模型Vicuna对齐，可以根据给定图像写故事和诗歌，为图 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博