深度学习提升SOTA的tricks大盘点

江大白 · 公众号 · · 2024-06-05 08:00

文章预览

以下文章来源于微信公众号：极市平台作者：极市平台链接：https://mp.weixin.qq.com/s/0LAmVZ_mdn7rNxPmhiGzfQ 本文仅用于学术分享，如有侵权，请联系后台作删文处理导读深度学习算法的落地都需要尽可能的提升模型效果，这往往需要trick进行支撑。这些trick有的能够提升网络精度，有的能够加速收敛。本文总结了三位知乎答主的优质回答，分享了他们所收藏积累的一些高效tricks。 # 回答一作者：李国趸浙江大学硕士生来源链接：https://www.zhihu.com/question/540433389/answer/2549775065 抛砖引玉(卑微求一个秋招内推求私信)： R-Drop：两次前向+KL loss约束 MLM: 在领域语料上用mlm进一步预训练 (Post-training) EFL: 少样本下，把分类问题转为匹配问题，把输入构造为NSP任务形式. 混合精度fp16: 加快训练速度，提高训练精度多卡ddp训练的时候，用到梯度累积时，可以使用no ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

广东台今日关注 · 流感高发季如何对症服药？专家提醒：48小时内吃药最佳

5 小时前

广东台今日关注 · 已致53人遇难！西藏地震最新消息

5 小时前

广东民生DV现场 · 一道路立杆上摄像头密集？当地通报

21 小时前

广东民生DV现场 · 一公司用消费券抵工资，人社部门：已接到投诉

21 小时前

未名俱乐部 · 未名JOB | 中国兵工物资集团2025届校园招聘正式启动（校招）

3 月前

citexs赛特新思 · 审稿人告诉你，在什么情况下会选择拒稿？

2 月前