超越传统知识蒸馏，RLD方法在模型训练中的优势与实证分析！

arXiv每日学术速递 · 公众号 · · 2024-09-02 17:17

文章预览

最近的研究越来越集中在知识蒸馏领域，因为 logit 蒸馏具有简单性、有效性和模型压缩的多样性。在本文中，作者提出了改进型 logit 蒸馏（RLD），以解决现有 logit 蒸馏方法的局限性。作者的方法是由观察到即使高性能的教师模型也会做出错误的预测而引起的，这种冲突使得标准蒸馏损失与交叉熵损失之间产生了矛盾，进而可能破坏学生模型的学习目标的一致性。之前使用标签来实证修正教师预测可能削弱了类相关的稳定性。相比之下，作者的 RLD 方法使用标记信息动态地改进教师 logit。这样，作者的方法可以有效地消除教师中的误导信息，同时保留关键的类相关性，从而提高蒸馏知识的价值和效率。在 CIFAR-100 和 ImageNet 上的实验结果表明，它优于现有方法。代码提供在 https://github.com/zju-SWJ/RLD。 1 Introduction 知识蒸馏 [12]利用预训练的高性能老 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

21ic电子网 · RTOS中协程与任务的区别

昨天

旺材锂电 · 国轩高科：车规级全固态电芯“金石电池”计划 2027 年小批量生产及装车测试

2 天前

蔚来 · 加电小百科｜买电动车，一定要买电池吗？

3 天前

小米汽车 · 小米汽车答网友问（第九十七集）

5 天前

石榴婆报告 · 直播 | 38度的天气，给眼睛吃冰激凌

4 月前

秋叶PPT · 豆瓣4.4！王俊凯最新电影《749局》疯狂扑街，但这个细节我要夸爆！

1 月前

超越传统知识蒸馏，RLD方法在模型训练中的优势与实证分析 ！

文章预览

超越传统知识蒸馏，RLD方法在模型训练中的优势与实证分析！