专栏名称: 小白学视觉
本公众号主要介绍机器视觉基础知识和新闻,以及在学习机器视觉时遇到的各种纠结和坑的心路历程。
今天看啥  ›  专栏  ›  小白学视觉

顶刊解读 IJCV | CAE-GReaT: 卷积辅助高效图推理Transformer用于密集图像预测

小白学视觉  · 公众号  ·  · 2024-10-19 11:52

文章预览

点击上方“ CVPaper ”卡片,每天获取顶刊论文解读 CAE-GReaT: Convolutional-Auxiliary Efficient Graph Reasoning Transformer for Dense Imag CAE-GReaT: 卷积辅助高效图推理Transformer用于密集图像预测 Dong Zhang,Yi Lin, Jinhui Tang,Kwang-Ting Cheng 摘要 卷积神经网络(CNNs)和视觉变换器(ViT)是当前计算机视觉领域语义图像识别任务的两个主要框架。普遍的共识是,CNNs和ViT都有其潜在的优势和弱点,例如,CNNs擅长提取局部特征但难以聚合长距离特征依赖性,而ViT擅长聚合长距离特征依赖性但对局部特征的表示较差。在本文中,我们提出了一个辅助的集成网络架构,名为卷积辅助高效图推理变换器(CAE-GReaT),它将CNNs和ViT的优势结合到一个统一的框架中。CAE-GReaT站在先进图推理变换器的基础上,并采用内部辅助卷积分支来丰富局部特征表示。此外,为了降低图推理中的计算成本,我 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览