文章预览
计算机视觉研究院专栏 作者:Edison_G 京东AI研究院 提出的一种 新的注意力结构 。 将CoT Block代替了ResNet结构中的3x3卷积,来形成 CoTNet ,在分类检测分割等任务效果都出类拔萃! 公众号ID |ComputerVisionGzq 学习群 |扫码在主页获取加入方式 论文地址: https://arxiv.org/pdf/2107.12292.pdf 源代码地址: https://github.com/JDAI-CV/CoTNet 1 前言 具有自注意力的Transformer引发了自然语言处理领域的革命 ,最近还激发了Transformer式架构设计的出现,并在众多计算机视觉任务中取得了具有竞争力的结果。 如下是之前我们分享的基于 Transformer 的目标检测新技术! 链接:利用TRansformer进行端到端的目标检测及跟踪(附源代码) 链接: YOLOS:通过目标检测重新思考Transformer(附源代码) 尽管如此,大多数现有设计直接在2D特征图上使用自注意力来获得基于每个空间位置的独立查
………………………………