专栏名称: CV技术指南

长期更新：深度学习、计算机视觉相关技术的总结；图像处理相关知识；最新论文；经典论文；论文综述、tensorflow和pytorch等内容总结。涉及领域：神经网络模型、transformer模型、目标检测、语义分割、目标跟踪、视频理解等。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

能否仅依靠 LoRA 权重，而不依赖于预训练权重？PC-LoRA 给你答案！

CV技术指南 · 公众号 · · 2024-07-07 20:40

文章预览

前言低秩适应（LoRA）是一种显著的方法，通过向冻结的预训练权重中添加少量可学习参数，以实现参数高效的微调。启发于这样一个问题： “作者能否仅依靠LoRA权重，在微调的最后阶段使其表示足够，而不依赖于预训练权重？ ”在这项工作中，作者引入了渐进式压缩LoRA（PC-LoRA），它利用低秩适应（LoRA）同时执行模型压缩和微调。 PC-LoRA方法在训练过程中逐渐移除预训练权重，最终只留下低秩 Adapter 。因此，这些低秩 Adapter 替换了整个预训练权重，同时实现了压缩和微调的目标。 Pytorch训练营，花两个星期彻底掌握代码实现 CV各大方向专栏与各个部署框架最全教程整理 CV全栈指导班、基础入门班、论文指导班全面上线!! 1 Introduction 自从引入了预训练的 Transformer [27]模型以来，它们在自然语言处理（NLP）[1, 6]和计算机视觉（CV）[2, 7, 28]的一系 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

兴证固收研究 · 【兴证固收.信用】收益率和各类利差整体收窄——二级市场收益率和利差周度全跟踪（2024.05.20-2024.05.24）

9 月前

健康鄂尔多斯官方 · 健康科普 | 夏季便秘问题频发，这几个实用通肠妙招学起来～

6 月前

中医药课题申报 · 圈子我挤不进去，底子尚需时日，唯有本子可日臻完美

3 月前

中国化学十一化建 · 打赢生产经营“主动战” | 公司综合快讯

3 月前

能否仅依靠 LoRA 权重，而不依赖于预训练权重？PC-LoRA 给你答案 ！

文章预览

能否仅依靠 LoRA 权重，而不依赖于预训练权重？PC-LoRA 给你答案！