文章预览
作者提出了 D-FINE ,这是一个强大的实时目标检测器,通过重新定义DETR模型中的边界框回归任务,实现了出色的局部化精度。 D-FINE包括两个关键组件: 细粒度分布精炼(FDR) 和 全局最优定位自蒸馏(GO-LSD) 。 FDR将回归过程从预测固定坐标转换为迭代优化概率分布,提供了一个细粒度的中间表示,显著提高了定位精度。GO-LSD是一种双向优化策略,通过自蒸馏将定位知识从精炼分布转移到更浅的层,同时简化了对更深层剩余预测任务的优化。 此外,D-FINE在计算密集型模块和操作中引入了轻量级优化,实现了速度和准确度的更好平衡。 具体而言,D-FINE-L/ 在NVIDIA T4 GPU上,124/78 FPS的性能下,在COCO数据集上实现了54.0% / 55.8% AP。 在Objects365上预训练后,D-FINE-L/ 达到了57.1% / 59.3% AP,超越了所有现有的实时检测器。此外,作者的方法通过增加5.3% AP,同时不
………………………………