Llama 405B背后的训练、对齐技术演变路径

包包算法笔记 · 公众号 · · 2024-07-25 10:00

文章预览

随着大模型的飞速发展，在短短一年半间就有了大幅度的技术迭代更新， LoRA，QLoRA，AdaLoRa，ZeroQuant，Flash Attention，DPO 等技术效果已经在工业界逐渐得到验证。过去半年又涌现出更多效果更好的技术和模型，从 Mamba2 ， Jamab a，TTT 等基座模型，到 Dora ， LoftQ ， GaLore 等最新的微调技术； KTO ， IPO ， SimPO 等对齐技术；再到 GPTQ ， SmoothQuant ， AWQ ， GGUF 等量化技术。大模型全链路的技术的迭代日新月异。作为算法工程师，面对如此庞大又在飞速迭代的大模型技术体系，您是否有感觉自己的技术能力以及学习步伐有点跟不上技术的发展？或者对这些新兴技术的理解仅仅停留在应用层面上，实际上并没有对背后的算法原理深入剖析过？如果您希望快速适应大模型时代的发展，而不致于在海量的论文和技术文献中挣扎和迷茫；如果你希望在大模型赛道 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

IPRdaily · 聘！吉利控股集团招聘「知识产权工程师」

2 天前

招商电子 · 【招商电子】消费电子行业深度跟踪报告：AI手机、穿戴新品密集发布，持续看好AI端侧投资机遇

2 天前

中国证券报 · 兴业基金楼华锋：三维度重新定义红利投资

6 天前

中国证券报 · 资金强势入驻

6 天前

高绩效HR · 关键团队薪酬绩效激励方案设计与运营新实战（销售+研发+生产+高管）

3 月前

办公室主任 · 常州市原副秘书长：文稿之要在于谋人、谋事、谋篇、谋章句

2 月前