“我”变小了但更强了！英伟达发布最新大语言模型压缩技术，无损性能且提升数倍！

深蓝AI · 公众号 · · 2024-09-07 09:38

文章预览

英伟达研究团队提出了一份全面报告，详细介绍了如何使用剪枝和蒸馏技术将 Llama 3.1 8B 和 Mistral NeMo 12B 模型分别压缩至4B和8B参数。他们探索了两种不同的剪枝策略：深度剪枝和联合隐藏/注意力/MLP（宽度）剪枝。研究人员使用 LM Evaluation Harness 中的常用基准测试对压缩结果进行了评估。这些模型通过 NeMo Aligner 进行对齐，并在指令调优版本中进行了测试。这种方法成功地从Llama 3.1 8B产生了一个令人信服的 4B模型，并从Mistral NeMo 12B产生了一个最先进的Mistral-NeMo-Minitron-8B （简称 MN-Minitron-8B ）模型。研究团队发现，在没有访问原始数据的情况下，对教师模型在蒸馏数据集上进行轻微的微调是有益的。这一发现为在有限资源条件下优化大型语言模型提供了新的思路。为了促进社区合作和进一步研究，研究团队在 Hugging Face 平台上开源了他们的基础 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

白云仙院 · 中医：生发汤治疗脱发，内服加外用，疗效显著！

昨天

老张投资笔记 · 中医馆怎么办？

2 天前

度房苏州 · 刚刚！尹山湖南控规大曝光：一区三园！对标国际一流、产创融合的科技新城！

3 天前

高通中国 · 一加Ace 3 Pro体验报告：以优雅致敬巅峰的性能猛兽

3 月前

新疆纪检监察 · 自治区退役军人事务厅党组成员、副厅长乾正峰接受纪律审查和监察调查

3 周前