专栏名称: 小白学视觉
本公众号主要介绍机器视觉基础知识和新闻,以及在学习机器视觉时遇到的各种纠结和坑的心路历程。
今天看啥  ›  专栏  ›  小白学视觉

卷积调制空间自注意力SpatialAtt,轻量高效,即插即用!

小白学视觉  · 公众号  ·  · 2025-01-20 11:07
    

文章预览

点击上方 “ 小白学视觉 ”,选择加" 星标 "或“ 置顶 ” 重磅干货,第一时间送达 一、论文信息   1 论文题目: Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition 中文题目: Conv2Former: 一种简单的视觉识别用的Transformer风格卷积网络 论文链接: https://arxiv.org/pdf/2211.11943 官方github: https://github.com/HVision-NKU/Conv2Former 所属机构: 天津南开大学计算机科学学院,字节跳动(新加坡) 核心速览: 本文提出了一种名为Conv2Former的简单Transformer风格的卷积神经网络(ConvNet),用于视觉识别任务。该网络通过简化自注意力机制,利用卷积调制操作来编码空间特征,展示了在图像分类、目标检测和语义分割等任务上优于现有流行ConvNets和视觉Transformer模型的性能。 二、论文概要    Highlight 图4. 消融实验。对于Conv2Former-T和Conv2Former-B,当核大小从5×5增加到21×21 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览