【NeurIPS2024】从因果角度重新思考视觉-语言模型适应中的失配问题

数据派THU · 公众号 · 大数据 · 2024-11-07 17:01

文章预览

来源：专知本文约1000字，建议阅读 5 分钟我们对下游任务数据中包含的语义进行解耦，并基于每个语义执行分类。基础视觉-语言模型（如CLIP）在下游任务中展示了出色的泛化能力。然而，CLIP在适应特定任务时存在两个层次的失配问题，即任务失配和数据失配。虽然软提示调优在一定程度上缓解了任务失配，但数据失配仍然是一个挑战。为分析数据失配的影响，我们重新审视了CLIP的预训练和适应过程，并构建了一个结构化因果模型。我们发现，尽管期望精确捕捉下游任务的相关信息，但与任务无关的知识影响了预测结果，并阻碍了真实图像与预测类别之间关系的建模。由于任务无关的知识是不可观察的，我们利用前门调整并提出因果引导的语义解耦与分类方法（CDC）来减少任务无关知识的干扰。具体而言，我们对下游任务数据中包含的语义进 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

数据派THU · 【CMU博士论文】优化的新视角：应对数据中毒、解决欧几里得优化问题，以及学习最小最大最优估计器

昨天

数据派THU · 基于Huffman树的层次化Softmax：面向大规模神经网络的高效概率计算方法

昨天

黑马程序员 · 大数据BI工程师，如何利用AI技术赋能工作？

昨天

黑马程序员 · 大数据BI工程师，如何利用AI技术赋能工作？

昨天

成都发布 · 川妹子，入选巴黎奥运会！

6 月前

锂电前沿 · 锂电/钠电/固态电池材料大全

6 月前