专栏名称: 深蓝学堂EDU
深蓝学院是专注于前沿科技的在线教育平台,为广大在校大学生、IT从业者、科研人员提供系统的前沿科技教育和咨询等服务。深蓝学院关注人工智能、机器人、增强现实等黑科技。
今天看啥  ›  专栏  ›  深蓝学堂EDU

“我”变小了但更强了!英伟达发布最新大语言模型压缩技术,无损性能且提升数倍!

深蓝学堂EDU  · 公众号  ·  · 2024-09-12 17:30
    

文章预览

*本文转载自【深蓝AI】公众号* 英伟达 研究团队提出了一份全面报告,详细介绍了如何使用剪枝和蒸馏技术将 Llama 3.1 8B 和 Mistral NeMo 12B 模型分别压缩至4B和8B参数。他们探索了两种不同的剪枝策略: 深度剪枝和联合隐藏/注意力/MLP(宽度)剪枝。 研究人员使用 LM Evaluation Harness 中的常用基准测试对压缩结果进行了评估。这些模型通过 NeMo Aligner 进行对齐,并在指令调优版本中进行了测试。 这种方法成功地从Llama 3.1 8B产生了一个令人信服的 4B模型 ,并从Mistral NeMo 12B产生了一个 最先进的Mistral-NeMo-Minitron-8B (简称 MN-Minitron-8B )模型。 研究团队发现,在 没有访问原始数据 的情况下,对教师模型在蒸馏数据集上进行轻微的微调是有益的。这一发现为在有限资源条件下优化大型语言模型提供了新的思路。 为了促进社区合作和进一步研究,研究团队在 Huggin ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览