专栏名称: 计算机视觉工坊

专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台，我们坚持工坊精神，做最有价值的事~

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微博RSS订阅方法

即刻RSS订阅方法

深度学习中有哪些形式简单却很巧妙的idea？

计算机视觉工坊 · 公众号 · · 2024-11-10 00:00

主要观点总结

本文总结了计算机视觉领域中为了提高模型性能而采用的一系列策略和方法，包括调整训练策略、改变模型结构、优化超参数、使用复杂训练技巧等。

包括增大batch size、多训练epoch、调整样本使用次数、改变模型的下采样次数等，旨在通过不同的训练策略提高模型的性能。

通过调整学习率、优化器超参数、随机种子等，来改进模型的性能。其中有些超参数被隐藏在代码里，成为magic number。

将模型的relu替换为swish或leaky relu等，增加SE layer、便宜的attention连接等，通过模组之间的不同组合来提高模型性能。

包括使用复杂的损失函数、扩展模型组件、加入预训练参数等，以提高模型的起点和上限。

使用多种测试方法和评价指标，例如只报告部分进步的指标、故意让测试方法和训练场景不对齐等，来优化测试结果。

包括抄袭并更名别人的方法、报告高性能但实际并未开源实验验证、直接写论文不实验等，提醒使用者需要注意这些方法可能存在的问题和风险。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博