Llama3.1-60B-Instruct：删除 10B 个参数-20240902083201

斌叔OKmath · 微博 · · 2024-09-02 08:32

文章预览

2024-09-02 08:32 本条微博链接 Llama3.1-60B-Instruct：删除 10B 个参数（15 %) ，性能损失最小，无需重新训练。使用 nyuntam——Github 上发布的用于模型压缩和自适应的全新开源工具包应用FLAP（基于波动的自适应结构化修剪）来压缩和加速Llama3.1-70b-instruct模型。 FLAP 可以在不牺牲性能的情况下显著减少模型尺寸和计算要求。与传统的修剪技术不同，FLAP 不需要重新训练，并可在不同的模块和层之间调整修剪率，为在资源受限的环境 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

经济学人双语精读 · DeepSeek火爆全球，外媒怎么报道？

昨天

中国生物救护与科学伦理 · 国际护林员奖申报截止日期延长，2月10日截止｜资讯

昨天

生物医用材料进展 · 北大/南科大/北科大AM：超顺磁复合水凝胶支架作为体内动态可监测治疗诊断平台用于骨关节炎再生

6 月前

京师智能E家 · 每周e学 | 微积分学习经验分享（2）

3 月前

钛和电子电气 · 服务推荐｜钛和可靠性服务盐雾试验，助力产品提升耐腐蚀性能

3 月前