专栏名称: 计算机视觉研究院
主要由来自于大学的研究生组成的团队,本平台从事机器学习与深度学习领域,主要在人脸检测与识别,多目标检测研究方向。本团队想通过计算机视觉战队平台打造属于自己的品牌,让更多相关领域的人了解本团队,结识更多相关领域的朋友,一起来学习,共同进步!
今天看啥  ›  专栏  ›  计算机视觉研究院

ResNet超强变体:京东AI新开源的计算机视觉模块!(附源代码)

计算机视觉研究院  · 公众号  ·  · 2024-09-14 14:00

文章预览

计算机视觉研究院专栏 京东AI研究院 提出的一种 新的注意力结构 。 将CoT Block代替了ResNet结构中的3x3卷积,来形成 CoTNet ,在分类检测分割等任务效果都出类拔萃! 公众号ID |ComputerVisionGzq 学习群 |扫码在主页获取加入方式 论文地址: https://arxiv.org/pdf/2107.12292.pdf 源代码地址: https://github.com/JDAI-CV/CoTNet 1 前言 具有自注意力的Transformer引发了自然语言处理领域的革命 ,最近还激发了Transformer式架构设计的出现,并在众多计算机视觉任务中取得了具有竞争力的结果。 如下是之前我们分享的基于 Tr ansf ormer 的目标检测新技术! 链接:利用TRansformer进行端到端的目标检测及跟踪(附源代码) 链接: YOLOS:通过目标检测重新思考Transformer(附源代码) 尽管如此,大多数现有设计直接在2D特征图上使用自注意力来获得基于每个空间位置的独立查询和键对的注 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览