文章预览
在近年来数据集提炼已经迅速发展的同时,多模态数据的提炼,例如图像-文本对,提出了独特且尚未深入探索的挑战。与单模态数据不同,图像-文本对比学习(ITC)数据缺乏固有的分类,而应该更加注重模态之间的对应关系。 在这项工作中,作者提出了用于多模态数据集提炼的 低秩 相似性挖掘( LoRS ),它同时提炼带有图像-文本对的Ground Truth相似性矩阵,并利用低秩分解以提高效率和可扩展性。 所提出的方法对现有算法带来了显著的改进,对视觉-语言数据集提炼领域做出了重要贡献。 作者主张采用LoRS作为图像-文本数据集提炼的基础合成数据设置。 作者的代码可在https://github.com/silicx/LoRS_Distill获取 。 1 Introduction 数据集蒸馏能够在保留其基本信息和模型训练性能的同时,合成一个更小且更紧凑的数据集。由于它具有很高的压缩比,在机器学习
………………………………