LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究

量子位 · 公众号 · AI · 2024-05-20 17:39

文章预览

克雷西发自凹非寺量子位 | 公众号 QbitAI 大数据巨头Databricks与哥伦比亚大学最新研究发现，在数学和编程任务上，LoRA干不过全量微调。具体来说，在这两种任务中，LoRA模型的精确度只有后者的八到九成左右。不过，作者也发现，LoRA虽然学得少，但是“记忆力”却更好，遗忘现象要比全量微调少得多。究其原因，作者认为是数学和代码任务的特性与LoRA的低秩“八字不合”，遗忘更少也与秩相关。但LoRA的一个公认的优势是训练成本更低；而且相比全量微调，能够更好地保持原有模型性能。于是，网友们的看法也自然地分成了两派：一波人认为，单纯考虑降低成本用LoRA，表现却显著降低，这是不可接受的。更具针对性的，有人指出，对于数学和代码这样对精度要求高的任务，一定要最大程度地保证性能，哪怕牺牲一些训练成本。另一 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【[228星]Flock：基于工作流的低代码平台，快速构建聊天机-20250223130847

11 小时前

爱可可-爱生活 · 【[2.2k星]Obsidian Day Planner：Obs-20250222130420

昨天

爱可可-爱生活 · 本文揭示了现代自编码器潜在空间高频成分过多的问题会阻碍潜在扩散模-20250222053355

昨天

人工智能那点事 · “80后已死5.2%”？这么离谱的假消息! AI的锅？

2 天前

爱可可-爱生活 · 本文创新性地提出了 MuDAF 方法，通过在注意力头层面应用对比-20250221055216

2 天前

美妆网 · 展商说丨神彩权俊：iPDE，聚焦创新，引领未来！

8 月前

北大纵横 · 房子，何时才真正值得买？

7 月前

观察者网 · 董明珠称小米空调侵权赔了50万，小米否认

2 月前