专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
今天看啥  ›  专栏  ›  极市平台

顶刊TPAMI 2024!黄高团队提出EfficientTrain++:高效视觉骨干训练方法

极市平台  · 公众号  · 科技自媒体  · 2024-05-28 22:00
    

主要观点总结

本文介绍了EfficientTrain++:一种用于视觉基础网络训练的广义课程学习算法。该算法旨在通过逐步揭示数据的由易到难的特征或模式,提高模型训练效率。文章详细阐述了研究动机、方法简介、实验结果及研究细节。

关键观点总结

关键观点1: 研究动机

随着模型尺寸和训练数据规模的增大,计算机视觉模型的训练开销日益高昂,成为制约模型进一步发展和工业应用的关键因素。清华大学的研究团队提出了一种广义课程学习(Generalized Curriculum Learning)算法,旨在解决这一问题。

关键观点2: 方法简介

广义课程学习的核心思想在于,不进行数据维度的筛选,一直使用全部训练数据,但在训练过程中逐步揭示每个数据样本的由易到难的特征或模式。该算法通过融合频域和空域的两个核心发现,提出了EfficientTrain++方案,包括低频裁切和强度可调的空域数据增强等技术。

关键观点3: 实验结果

EfficientTrain++在多种视觉基础网络上实现了性能无损的训练加速,可降低1.5倍左右的训练开销。该算法通用于不同的训练数据规模、训练开销和不同的网络结构。对于较小的模型,还可以实现显著的性能提升。


文章预览

↑ 点击 蓝字  关注极市平台 作者丨机器之心 来源丨机器之心 编辑丨极市平台 极市导读   即插即用地实现视觉基础网络  1. 5−3.0× 无损训练加速 。上游、下游模型性能均不损失。实测速度与理论结果一致。 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 本论文作者王语霖是清华大学自动化系 2019 级直博生,师从吴澄院士和黄高副教授,主要研究方向为高效深度学习、计算机视觉等。他曾以第一作者在 TPAMI、NeurIPS、ICLR、ICCV、CVPR、ECCV 等期刊、会议上发表论文,曾获百度奖学金、微软学者、CCF-CV 学术新锐奖、字节跳动奖学金等荣誉。个人主页:wyl.cool 本文主要介绍刚刚被 IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)录用的一篇文章:EfficientTrain++: Generalized Curriculum Learning for Efficient Visual Backbone Training。 论文链接: https://arxiv.org/pd ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览