ProtoCLIP：原型对比语言图像预训练

FightingCV · 公众号 · · 2024-11-26 10:13

文章预览

摘要对比语言图像预训练 (CLIP) 已经受到了广泛关注，因为它学习到的表征可以很好地迁移到各种下游任务中。在 CLIP 模型的训练过程中，InfoNCE 目标函数对齐正样本图像-文本对，并分离负样本对。我们展示了在此过程中潜在的表征分组效应：InfoNCE 目标函数通过随机出现的模态内锚点间接地将语义相似的表征分组在一起。基于此理解，本文介绍了原型对比语言图像预训练 (ProtoCLIP) 来增强这种分组，提高其效率并增强其对模态差距的鲁棒性。具体来说，ProtoCLIP 在图像和文本空间之间建立了原型级别的判别，有效地迁移了更高层次的结构知识。此外，提出了原型反向翻译 (PBT) 来将表征分组与表征对齐解耦，从而在较大的模态差距下有效学习有意义的表征。 PBT 还使我们能够引入具有更丰富先验语言知识的额外外部教师。 ProtoCL ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

房频 · 即将开盘，或5.2万/平起！越秀熙悦江湾选筹攻略来了

5 小时前

财宝宝 · 物理好难啊。石子，扔出去，靠惯性在天空中飞一百-20250219133541

15 小时前

财宝宝 · 给大家看看，你们大杨莆的审美风格。哈色特宁了。 -20250219120652

16 小时前

财宝宝 · @星河-金：我没有工作了，就去接了家教中心。一开始可以准备一点相-20250216223118

3 天前

财宝宝 · 我相信，正常人都不认识这个初二作业了animated -20250216213555

3 天前

天津科技大学 · 【笃行实干做“先锋”】连续三年入围“国创年会”！项目入围数量位居市属高校第一！

6 月前

冰城新闻 · 演员孙俪突然发文，邓超回应！

1 月前