专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

通过分析LLM预训练中梯度动态,发现不同层低秩结构以非均匀方式出-20240718053935

爱可可-爱生活  · 微博  · AI  · 2024-07-18 05:39

文章预览

2024-07-18 05:39 本条微博链接 通过分析LLM预训练中梯度动态,发现不同层低秩结构以非均匀方式出现,并提出自适应层级低秩压缩与仅反向传播LRCs的高效联合微调策略WeLore。 [LG]《From GaLore to WeLore: How Low-Rank Weights Non-uniformly Emerge from Low-Rank Gradients》A Jaiswal, L Yin, Z Zhang, S Liu... [University of Texas at Austin University of S ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览