专栏名称: CV技术指南
长期更新:深度学习、计算机视觉相关技术的总结;图像处理相关知识;最新论文;经典论文;论文综述、tensorflow和pytorch等内容总结。涉及领域 :神经网络模型、transformer模型、目标检测、语义分割、目标跟踪、视频理解等。
今天看啥  ›  专栏  ›  CV技术指南

YOLC 来袭 | 遥遥领先 !YOLO与CenterNet思想火花碰撞,让小目标的检测性能原地起飞,落地价值极大 !

CV技术指南  · 公众号  ·  · 2024-04-15 15:14

文章预览

前言   从空中图像中检测物体由于以下因素而面临重大挑战:1.  空中图像通常具有非常大的尺寸,一般有数百万甚至数亿像素,而计算资源是有限的; 2.   小物体尺寸导致有效检测信息不足;3.  不均匀的物体分布导致计算资源的浪费。 为了解决这些问题,作者提出了YOLC(You Only Look Clusters),这是一个高效且有效的框架, 建立在 Anchor-Free 点目标检测器CenterNet之上 。 为了克服大规模图像和不均匀物体分布带来的挑战,作者引入了一个局部尺度模块(LSM),该模块自适应搜索聚类区域进行放大以实现精确检测。 此外,作者使用高斯Wasserstein距离(GWD)修改回归损失,以获得高质量的边界框。 在检测Head中采用了可变形卷积和细化方法,以增强小物体的检测。 作者在两个空中图像数据集上进行了大量实验,包括Visdrone2019和UAVDT,以证明YOLC的有效性 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览