专栏名称: PaperWeekly
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
今天看啥  ›  专栏  ›  PaperWeekly

揭秘视觉表征学习中的骨干网络-优化器耦合偏好(BOCB)

PaperWeekly  · 公众号  · 科研  · 2024-10-15 13:40

文章预览

©PaperWeekly 原创 · 作者 | 田隽熙 单位 |  西湖大学 本研究深入探讨了视觉领域中骨干网络与优化器之间的偏好关系,揭示了“骨干网络-优化器耦合偏好”(Backbone-Optimizer Coupling Bias, BOCB)的现象。 论文标题: Unveiling the Backbone-Optimizer Coupling Bias in Visual Representation Learning 论文链接: https://arxiv.org/abs/2410.06373 项目主页: https://bocb-ai.github.io/ 实验观察表明,VGG 和 ResNet 等传统卷积神经网络(CNNs)较偏好 SGD 系列优化器;而以 Vision Transformers(ViTs)和 ConvNeXt 为代表的现代化深度网络(Modern DNNs),更偏好 AdamW 为代表的自适应学习率优化器,且表现出很强的耦合性。 本研究构建了 20 个代表性骨干网络和 20 个优化器的 BOCB 基准,发现特定网络设计或优化器会导致 BOCB 现象,且可能显著影响视觉模型的预训练性能和下游任务泛化性。 结合分析工具和具体 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览