打破单模态局限，LoRS在多模态数据提炼上的突破！

集智书童 · 公众号 · · 2024-06-27 09:00

文章预览

在近年来数据集提炼已经迅速发展的同时，多模态数据的提炼，例如图像-文本对，提出了独特且尚未深入探索的挑战。与单模态数据不同，图像-文本对比学习（ITC）数据缺乏固有的分类，而应该更加注重模态之间的对应关系。在这项工作中，作者提出了用于多模态数据集提炼的低秩相似性挖掘（ LoRS ），它同时提炼带有图像-文本对的Ground Truth相似性矩阵，并利用低秩分解以提高效率和可扩展性。所提出的方法对现有算法带来了显著的改进，对视觉-语言数据集提炼领域做出了重要贡献。作者主张采用LoRS作为图像-文本数据集提炼的基础合成数据设置。作者的代码可在https://github.com/silicx/LoRS_Distill获取。 1 Introduction 数据集蒸馏能够在保留其基本信息和模型训练性能的同时，合成一个更小且更紧凑的数据集。由于它具有很高的压缩比，在机器学习 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

打破单模态局限，LoRS在多模态数据提炼上的突破 ！

文章预览

打破单模态局限，LoRS在多模态数据提炼上的突破！