专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

比LoRA更高效！上交大提出LoRA-Dash：释放特定任务方向性能的微调方法

PaperWeekly · 公众号 · 科研 · 2024-09-20 22:43

文章预览

©PaperWeekly 原创 · 作者 | Chong Jie 单位 | 上海交通大学研究方向 | 参数高效微调我们于 2024 年 9 月 2 日在 arXiv 提交了我们最新的工作——LoRA-Dash：文章链接： https://arxiv.org/abs/2409.01035 代码链接： https://github.com/Chongjie-Si/Subspace-Tuning 项目主页： https://chongjiesi.site/project/2024-lora-dash.html 由于 LoRA-Dash 论文内容丰富，将 30 页的内容压缩到 10 页是一个极具挑战的任务。为此，我们在保持可读性与内容完整性之间做出了审慎的权衡与取舍。本文的出发点可能与原论文有所不同，反而更符合我们最初的动机和目标。研究动机 1.1 top, bottom还是random？ LoRA 已无需多作介绍，作为微调领域家喻户晓的方法之一，其影响广泛。在此前调研相关方法时，我注意到有几篇专门讨论 LoRA 初始化的研究工作： PISSA：认为 LoRA 初始化中的矩阵 A 和 B 应对应于权重矩阵 W 的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博