注册
登录
专栏名称:
量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
《爱可可微博热门分享(11.30)》 ...
·
2 天前
爱可可-爱生活
·
晚安~ #晚安# -20241130223641
·
2 天前
爱可可-爱生活
·
【ComfyUI-enricos-nodes ...
·
2 天前
宝玉xp
·
问:宝玉老师好!IT ...
·
3 天前
爱可可-爱生活
·
【Awesome Foundation ...
·
5 天前
今天看啥
›
专栏
›
量子位
参数少80%,效果仍超LoRA!上交大&上海AI Lab推出高效微调框架FLoRA
量子位
·
公众号
·
AI
· 2024-07-03 11:59
文章预览
Huiser 投稿 量子位 | 公众号 QbitAI 为了让大模型在特定任务、场景下发挥更大作用, LoRA 这样能够平衡性能和算力资源的方法正在受到研究者们的青睐。 然而,以LoRA为代表的众多低秩微调方法 (包括DoRA, MoRA, AdaLoRA等衍生方法) 仍存在一个问题: 它们通常通常都更适合Linear层,Embedding层这类“直入直出”的低维度张量,忽略了对更高维度甚至N维张量的考虑。 尽管这些方法可以通过一定方式将高维度张量转化为2D张量来微调参数,如LoRA将Conv2D卷积层参数所具有的四维张量 转化为二维张量 。但其存在两方面的挑战: 这种将卷积核 拆开分别reshape到 , 维度上的方法虽然避免了参数的大规模增加,但是破坏了卷积核本身的结构特性。这对于密集预测类任务所需要的局部归纳偏置是一种负向影响。 随着张量维度的升高,reshape为二维的方式会造成急剧 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
《爱可可微博热门分享(11.30)》 爱可可微博热门分享(11-20241130223613
2 天前
爱可可-爱生活
·
晚安~ #晚安# -20241130223641
2 天前
爱可可-爱生活
·
【ComfyUI-enricos-nodes:一个功能强大的Co-20241130201155
2 天前
宝玉xp
·
问:宝玉老师好!IT 专业(business informati-20241129140951
3 天前
爱可可-爱生活
·
【Awesome Foundation Model ROS:一个-20241127130653
5 天前
3D视觉之心
·
任意尺度超分辨率新方法!GaussianSR:打破传统离散特征表示能力的限制!
4 月前