卷积调制空间自注意力SpatialAtt，轻量高效，即插即用！

小白学视觉 · 公众号 · · 2025-01-20 11:07

文章预览

点击上方 “ 小白学视觉 ”，选择加" 星标 "或“ 置顶 ” 重磅干货，第一时间送达一、论文信息 1 论文题目： Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition 中文题目： Conv2Former: 一种简单的视觉识别用的Transformer风格卷积网络论文链接： https://arxiv.org/pdf/2211.11943 官方github： https://github.com/HVision-NKU/Conv2Former 所属机构：天津南开大学计算机科学学院，字节跳动（新加坡）核心速览：本文提出了一种名为Conv2Former的简单Transformer风格的卷积神经网络（ConvNet），用于视觉识别任务。该网络通过简化自注意力机制，利用卷积调制操作来编码空间特征，展示了在图像分类、目标检测和语义分割等任务上优于现有流行ConvNets和视觉Transformer模型的性能。二、论文概要 Highlight 图4. 消融实验。对于Conv2Former-T和Conv2Former-B，当核大小从5×5增加到21×21 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

Linux就该这么学 · 标普：谷歌独占约7成去年新车所搭载车机系统份额，远超第二名Linux

4 小时前

Linux就该这么学 · 当了leader才发现，大厂最想裁掉的，不是上班总迟到的，也不是下班搞失联的，而是经常把这3句话挂在嘴边的！

4 小时前

Linux就该这么学 · 三分钟读懂 Linux 权限体系：从小白到运维高手的第一步

昨天

Linux就该这么学 · 9.5k star，一款高颜值、现代化的 Git 可视化管理工具

昨天

博物倌 · 奥运主题互动体验馆设计

5 月前

四大新鲜事儿 · 恭喜！德勤拿下1家A股新客户！

2 周前