专栏名称: 计算机视觉研究院

主要由来自于大学的研究生组成的团队，本平台从事机器学习与深度学习领域，主要在人脸检测与识别，多目标检测研究方向。本团队想通过计算机视觉战队平台打造属于自己的品牌，让更多相关领域的人了解本团队，结识更多相关领域的朋友，一起来学习，共同进步！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

Transformer工业部署落地！超越ResNet、CSWin（附源码）

计算机视觉研究院 · 公众号 · · 2024-09-01 17:30

文章预览

关注并星标从此不迷路计算机视觉研究院公众号ID ｜ ComputerVisionGzq 学习群｜扫码在主页获取加入方式论文地址：https://arxiv.org/pdf/2207.05501.pdf 计算机视觉研究院专栏一种用于在现实工业场景中高效部署的下一代 Vision Transformer。它通过引入 Next Convolution Block (NCB) 和 Next Transformer Block (NTB)，在局部和全局信息捕获方面取得了显著的性能改进。一、总概述 NCB 和 NTB 分别使用新颖的部署友好的多头卷积注意力 (MHCA) 和轻量级的高低频信号混合器来增强建模能力。为了进一步提高性能，设计了 Next Hybrid Strategy (NHS)，通过在每个阶段以新的混合范式堆叠 NCB 和 NTB，大大降低了 Transformer 块的比例，并在各种下游任务中最大程度地保留了 Vision Transformer 网络的高精度。与现有的基于 CNN 和 ViT 的方法相比，Next-ViT 在延迟/准确性权衡方面表现出优越的性能。实 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博