一个百度人的技术提升之路,为您提供一系列计算机视觉,自然语言处理和推荐系统等高质量技术文章,让您的碎片化时间最大价值化
今天看啥  ›  专栏  ›  深度学习基础与进阶

D-FINE:在DETR中将回归任务作为分布来细化

深度学习基础与进阶  · 公众号  ·  · 2025-02-08 18:32
    

文章预览

导读 我们的方法显著增强了各种DETR模型的性能,最多提高了5.3% 的AP,而额外的参数和训练成本几乎可以忽略不计。 摘要 我们介绍了D-FINE,这是一种强大的实时目标检测器,通过重新定义DETR模型中的边界框回归任务实现了卓越的定位精度。D-FINE包含两个关键组件:细粒度分布精炼(Fine-grained Distribution Refinement, FDR)和全局最优定位自蒸馏(Global Optimal Localization Self-Distillation, GO-LSD)。FDR将回归过程从预测固定坐标转变为迭代地精炼概率分布,提供了一个细粒度的中间表示,这大大提升了定位的准确性。GO-LSD是一种双向优化策略,它通过自蒸馏将定位知识从精炼的分布转移到较浅的层,同时简化了更深层的残差预测任务。 此外,D-FINE在计算密集型模块和操作中引入了轻量级优化,从而在速度和准确性之间达到了更好的平衡。具体来说,D-FINE-L / X 在N ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览