ConaCLIP：探索用于轻量级文本-图像检索的全连接知识交互图的蒸馏

arXiv每日学术速递 · 公众号 · · 2024-11-09 17:04

文章预览

摘要具有双编码器架构的大规模预训练文本-图像模型（例如 CLIP Radford et al. (2021) ）通常被用于各种视觉-语言应用，包括文本-图像检索。然而，由于大量的索引和推理时间以及大量的计算资源消耗，这些模型在边缘设备或实时情况下仍然不太实用。尽管知识蒸馏技术已被广泛用于单模态模型压缩，但很少有人研究如何将它们扩展到模态和教师/学生数量都加倍的情况。 In this paper, we conduct comprehensive experiments on this topic and propose the fully- C onnected kn o wledge interactio n gr a ph (Cona) technique for cross-modal pre-training distillation. 根据我们的发现，生成的 ConaCLIP 在广泛使用的 Flickr30K 和 MSCOCO 基准测试中，在轻量级设置下实现了 SOTA 性能。我们方法在电子商务平台上的行业应用进一步证明了 ConaCLIP 的显著有效性。 1 1 引言文本-图像检索（TIR）旨在从给定 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

株洲交通984 · 全国两会湖南团全团建议出炉！涉及交通运输领域的有这些……

23 小时前

潇湘晨报 · 主办方再次道歉！补偿方案公布→

昨天

潇湘晨报 · 微信官宣新功能！网友：好爽！终于等到了......

2 天前

新闻株洲 · 国内100个“值得去的小城”，株洲一地上榜！

3 天前

潇湘晨报 · 已团聚！岳阳小伙刷短视频发现走失20多年妈妈，求助民警当天确认：果然是

3 天前

ioncology · 星海论坛丨郭宝良、徐贵颖、邱鹏飞、王浩教授分享乳腺癌ctDNA监测应用的研究进展

8 月前

科研云 · 【今天14:15】|「理大创科 × 校友日2024」见证理大非凡成就推动香港创科发展

4 月前

上海经信委 · 上海：数智技术“电”亮发展向“新”力

1 月前

上海经信委 · 上海：数智技术“电”亮发展向“新”力

1 月前