超越传统知识蒸馏，RLD方法在模型训练中的优势与实证分析！

灵度智能 · 公众号 · · 2024-09-02 12:15

文章预览

点击下方卡片，关注「AI视界引擎」公众号 ( 添加时备注：方向+学校/公司+昵称/姓名 ) 最近的研究越来越集中在知识蒸馏领域，因为 logit 蒸馏具有简单性、有效性和模型压缩的多样性。在本文中，作者提出了改进型 logit 蒸馏（RLD），以解决现有 logit 蒸馏方法的局限性。作者的方法是由观察到即使高性能的教师模型也会做出错误的预测而引起的，这种冲突使得标准蒸馏损失与交叉熵损失之间产生了矛盾，进而可能破坏学生模型的学习目标的一致性。之前使用标签来实证修正教师预测可能削弱了类相关的稳定性。相比之下，作者的 RLD 方法使用标记信息动态地改进教师 logit。这样，作者的方法可以有效地消除教师中的误导信息，同时保留关键的类相关性，从而提高蒸馏知识的价值和效率。在 CIFAR-100 和 ImageNet 上的实验结果表明，它优于现有方法 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

TGB湖南人 · 【12.24复盘】缩量反弹，无人看好？来一根放量阳线就老实了。。。

4 小时前

TGB湖南人 · 【12.23复盘】指数微跌，个股普跌，银行股又成资金避风港了。。。

昨天

TGB湖南人 · 【12.20复盘】热点都在一日游，前期强势板块回暖，难道题材还是老的辣。。。

4 天前

重庆电力交易中心 · 关于查看组织2025年重庆市年度绿色电力交易公告的通知

4 天前

TGB湖南人 · 【12.19复盘】好消息反弹了，坏消息比昨天收盘还低，低开的反弹算反弹吗？

5 天前

自在睡觉 · 这样做，能提升今年运势

4 月前

奔波儿灞与灞波儿奔 · 路边的茶叶店、五金店都没人去，为啥还不倒闭？

3 月前

奔波儿灞与灞波儿奔 · 路边的茶叶店、五金店都没人去，为啥还不倒闭？

3 月前

清海地产研究 · 【周度专题】如何看待基建资金到位情况？——2024W39建筑周报丨方正地产建筑刘清海团队

3 月前

天然橡胶 · 橡胶现货：一路飙升「20240923-20240929」

2 月前

超越传统知识蒸馏，RLD方法在模型训练中的优势与实证分析 ！

文章预览

超越传统知识蒸馏，RLD方法在模型训练中的优势与实证分析！