今天看啥  ›  专栏  ›  吃果冻不吐果冻皮

大模型微调和对齐,这些方法更替太快了!

吃果冻不吐果冻皮  · 公众号  ·  · 2024-07-23 12:00

文章预览

随着大模型的飞速发展,在短短一年半间就有了大幅度的技术迭代更新, LoRA,QLoRA,AdaLoRa,ZeroQuant,Flash Attention,DPO 等技术效果已经在工业界逐渐得到验证。过去半年又涌现出更多效果更好的技术和模型, 从 Mamba2 , Jamab a,TTT 等 基座模型 , 到 Dora , LoftQ , GaLore 等最新的微调技术; KTO , IPO , SimPO 等对齐技术;再到 GPTQ , SmoothQuant , AWQ , GGUF 等量化技术。大模型全链路的技术的迭代日新月异。 作为算法工程师, 面对如此庞大又在飞速迭代的大模型技术体系, 您是否有感觉自己的技术能力以及学习步伐有点跟不上技术的发展?或者对这些新兴技术的理解仅仅停留在应用层面上,实际上并没有对背后的算法原理深入剖析过? 如果您希望快速适应大模型时代的发展,而不致于在海量的论文和技术文献中挣扎和迷茫;如果你希望在大模型赛道 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览