专栏名称: CV技术指南
长期更新:深度学习、计算机视觉相关技术的总结;图像处理相关知识;最新论文;经典论文;论文综述、tensorflow和pytorch等内容总结。涉及领域 :神经网络模型、transformer模型、目标检测、语义分割、目标跟踪、视频理解等。
今天看啥  ›  专栏  ›  CV技术指南

超越 YOLOv8, MAF-YOLO 利用重参化异构卷积大幅度提升多尺度信息融合能力 !

CV技术指南  · 公众号  ·  · 2024-08-03 09:10

文章预览

前言   由于多尺度特征融合的有效性能,路径聚合FPN(PAFPN)被广泛应用于YOLO检测器中。 然而,它不能同时高效且自适应地融合高级语义信息与低级空间信息。本文提出了一种名为MAF-YOLO的新模型,这是一个具有多功能 Neck 网络的新颖目标检测框架,名为多分支辅助FPN(MAFPN)。 在MAFPN中,设计了表面辅助融合(SAF)模块,以将 Backbone 网络的输出与 Neck 网络相结合,保留适量的浅层信息以促进后续学习。同时,高级辅助融合(AAF)模块深植于 Neck 网络内,向输出层传递更为丰富的梯度信息。 此外,作者提出的重参化异构高效层聚合网络(RepHELAN)模块确保了整体模型架构和卷积设计对异构大型卷积核的利用。因此,这保证了在同时实现多尺度感受野的同时保留与小目标相关的信息。 Pytorch训练营,花两个星期彻底掌握代码实现 CV各大方向专栏与各 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览