今天看啥  ›  专栏  ›  小白玩转Python

YOLO 中 anchors 和 grids 的故事

小白玩转Python  · 公众号  ·  · 2024-06-07 20:01
    

文章预览

点击下方 卡片 ,关注“ 小白玩转Python ”公众号 在本文中,我们将解析 YOLOv5 目标检测模型的三个检测头的输出,并理解网格和锚点的概念。 您可以将这一概念推广到其他版本的 YOLO。值得注意的是,所有 YOLOv5 模型(s、m、l、x)的三个检测头的输出张量形状都是相同的。 上图是 YOLOv5s 模型转换为 ONNX 格式后的 Netron 表示。图像显示了模型的边界框解码部分,我们将尝试理解这里发生的事情。 图像顶部的三个卷积操作是检测头的输出。卷积头的输出形状如下: head 1:3x80x80x117 -> 检测小尺寸目标 head  2:3x40x40x117 -> 检测中等尺寸 目标 head  3:3x20x20x117 -> 检测大尺寸 目标 接下来,我们将详细解析 head  1。 什么是117?  数字117指的是 YOLOv5 目标检测模型输出张量的通道数。这可以进一步分解为: 目标得分:表示目标存在的概率。 𝛅x:预测边界框原 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览