今天看啥  ›  专栏  ›  大淘宝技术

Open-Set目标检测算法的原理与实践

大淘宝技术  · 公众号  ·  · 2024-11-25 19:38

文章预览

在深度学习领域,目标检测算法用于识别和定位图像中的特定对象,是计算机视觉中至关重要的任务。然而, 传统的目标检测算法只能在有限类目的数据集上进行推理 ,这是因为训练集中的类别是有限的,推理时也只能识别这些有限的类目,限制了其应用范围。因此, 我们需要使用开放集(Open-Set)检测技术,开放集检测可以在推理过程中识别训练时未被见过的类目。为了丰富交互方式,我们还将采用视觉定位(Visual Grounding)检测,将图像和自然语言描述一起作为输入 。 YOLO-World (CVPR 2024)、Grounding DINO (ECCV 2024) 是SOTA的开放集目标检测算法, YOLO11 (Ultralytics  2024) 则是今年9月最新开源的闭集YOLO检测算法。在这篇文章中,我们将对这三种SOTA算法的原理进行解析,并进行相关实践。 相关基础知识 ▐   1. Visual Grounding 图像来源于YOLO-World论文 视觉定 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览