注册登录

专栏名称: YeungNLP

Firefly开源中文大语言模型官方公众号。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

架构师之路 · 弄懂《算法导论》，超过90%的人，也没什么好 ... · 昨天

美团技术团队 · 鸿蒙应用签名实操及机制探究 · 4 天前

美团技术团队 · 美团机器人研究院学术年会，学者热议具身智能如 ... · 4 天前

架构师之路 · 架构师如何高效管理1000w+延时任务？？？ ... · 4 天前

今天看啥 › 专栏 › YeungNLP

Qwen知识蒸馏小试牛刀，在MT-Bench与AlpacaEval 2.0的表现大幅提升

YeungNLP · 公众号 · · 2024-07-08 12:02

文章预览

01 前言本文主要分享我们在大模型知识蒸馏上的实验尝试，以及所取得的实验效果提升。我们在5月份完成了该实验，但由于各种原因，实验分享🕊️了两个月。由于彼时Qwen2尚未发布，且我们的训练资源有限，所以我们选择将Qwen1.5-32B-Chat-AWQ蒸馏到Qwen1.5-14B中。在AlpacaEval 2.0和MT-Bench评测集中，我们得到以下两个主要的实验结果：使用同一份训练数据，蒸馏得到的模型大幅优于直接SFT的模型。蒸馏可弥补数据质量导致的差距，蒸馏得到的模型比官方Qwen1.5-14B-Chat模型有比较明显的提升。下表是我们蒸馏的14B模型与官方Qwen1.5-14B-Chat在AplacaEval 2.0评测集中的评测结果。这表明大模型知识蒸馏的有效性，相较于直接SFT，知识蒸馏能够进一步提升模型的性能，可作为大模型压缩和加速推理的有效手段。近期谷歌开源的Gemma-2-9B也使用了知识蒸馏的方法，业 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

架构师之路 · 弄懂《算法导论》，超过90%的人，也没什么好骄傲的...

昨天

美团技术团队 · 鸿蒙应用签名实操及机制探究

4 天前

美团技术团队 · 美团机器人研究院学术年会，学者热议具身智能如何走进生活

4 天前

架构师之路 · 架构师如何高效管理1000w+延时任务？？？（第31讲）

4 天前

禽报网 · 鸡报•5-30\\说禽不聊猪，犹如瞎秃噜！猪肉这几天风云际会，期待能给鸡带来点好运！

7 月前

爱浦电源 · 展会预告 | 2024慕尼黑上海电子展

6 月前

会计雅苑 · 无力支付审计费，未按时披露年报，被罚120万！

5 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号