专栏名称: 集智书童
书童带你领略视觉前沿之美,精选科研前沿、工业实用的知识供你我进步与学习!
今天看啥  ›  专栏  ›  集智书童

打破单模态局限,LoRS在多模态数据提炼上的突破 !

集智书童  · 公众号  ·  · 2024-06-27 09:00

文章预览

在近年来数据集提炼已经迅速发展的同时,多模态数据的提炼,例如图像-文本对,提出了独特且尚未深入探索的挑战。与单模态数据不同,图像-文本对比学习(ITC)数据缺乏固有的分类,而应该更加注重模态之间的对应关系。 在这项工作中,作者提出了用于多模态数据集提炼的 低秩 相似性挖掘( LoRS ),它同时提炼带有图像-文本对的Ground Truth相似性矩阵,并利用低秩分解以提高效率和可扩展性。 所提出的方法对现有算法带来了显著的改进,对视觉-语言数据集提炼领域做出了重要贡献。 作者主张采用LoRS作为图像-文本数据集提炼的基础合成数据设置。 作者的代码可在https://github.com/silicx/LoRS_Distill获取 。 1 Introduction 数据集蒸馏能够在保留其基本信息和模型训练性能的同时,合成一个更小且更紧凑的数据集。由于它具有很高的压缩比,在机器学习 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览