专栏名称: NVIDIA企业开发者社区

NVIDIA 英伟达开发者社区是NVIDIA GPU开发者交流平台，通过此平台可第一时间获取NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

仓总嘉措 · 历时1年，南非报业终于要减完1个百分点 · 18 小时前

题材挖掘君 · 可控核聚变相关概念股一文全梳理（精选名单跟踪好） · 2 天前

嘶吼专业版 · 图解｜我国数据出境合规指引 · 2 天前

大象击股 · 注意！他们还没动！！！ · 3 天前

嘶吼专业版 · LastPass 发现虚假支持中心试图窃取客户数据 · 3 天前

今天看啥 › 专栏 › NVIDIA企业开发者社区

开发者新闻 | 如何在 NVIDIA Llama-3.1-Minitron 4B 模型上修剪和提炼 Llama-3.1 8B

NVIDIA企业开发者社区 · 公众号 · · 2024-08-22 15:07

文章预览

如何在 NVIDIA Llama-3.1-Minitron 4B 模型上修剪和提炼 Llama-3.1 8B 由于大型语言模型 (LLM) 的有效性和通用性，它们现在已经成为自然语言处理和理解领域的主导力量。LLM（例如 Llama 3.1 405B 和 NVIDIA Nemotron-4 340B ）在编码、推理和数学等许多具有挑战性的任务中表现出色。但是，它们的部署需要大量资源。因此，业内出现了另一种趋势，即开发小型语言模型 (SLM)，这些模型在许多语言任务中足够精通，但部署给大众的成本要便宜得多。最近，NVIDIA 研究人员表明，结构化权重剪枝与知识提炼相结合，形成了一种有效且高效的策略，可以从初始较大的同级产品中逐步获得较小的语言模型。NVIDIA Minitron 8B 和 4B 是如此小的模型，通过在 NVIDIA Nemotron 系列中剪枝和提炼其较大的 15B 同级产品来获得。 ▶ 剪枝和提炼可带来以下优势： ● 与从头开始训练相比，MML ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

仓总嘉措 · 历时1年，南非报业终于要减完1个百分点

18 小时前

仓总嘉措 · 历时1年，南非报业终于要减完1个百分点

18 小时前

题材挖掘君 · 可控核聚变相关概念股一文全梳理（精选名单跟踪好）

2 天前

题材挖掘君 · 可控核聚变相关概念股一文全梳理（精选名单跟踪好）

2 天前

嘶吼专业版 · 图解｜我国数据出境合规指引

2 天前

大象击股 · 注意！他们还没动！！！

3 天前

大象击股 · 注意！他们还没动！！！

3 天前

嘶吼专业版 · LastPass 发现虚假支持中心试图窃取客户数据

3 天前

医麦客 · 巨噬细胞疗法治疗终末期肝病，新锐公司融资5.8亿元推进管线开发

1 月前

电能革新 · 变压器下为什么放鹅卵石？鹅卵石下面又是啥？为什么要有水？

1 月前