文章预览
从今年CVPR的热门主题上来看,多模态相关的论文依然很火,不少同学也私信来问了,我就火速整理了一部分来和你们分享。 主要整理了6篇最新的多模态论文,还有10+篇经典的文章,论文包大家可以看这里领取! 扫码 添加小享,回复“ 多模态 ” 免费获取本次分享的 全部 论 文 看在这么高产的份儿上点个赞支持下叭~ CLIP-VG: Self-paced Curriculum Adapting of CLIP via Exploiting Pseudo-Language Labels for Visual Grounding 方法: 作者提出了CLIP-VG,利用预训练模型CLIP和伪语言标签进行自定进度课程适应,实现无监督地理定位。另外,作者也设计了端到端网络,并提出单/多源课程适应算法。 MiniGPT4: Enhancing Vision-Language Understanding with Advanced Large Language Models 方法: 作者提出MiniGPT-4,使用一个投影层将视觉编码器和语言模型Vicuna对齐,可以根据给定图像写故事和诗歌,为图
………………………………