有位大佬逐模块解析了基于transformer的目标检测网络

深度学习基础与进阶 · 公众号 · · 2024-06-26 12:48

文章预览

Transformer在计算机视觉领域大方异彩，Detection Transformer（DETR）是Transformer在目标检测领域的成功应用。利用Transformer中attention机制能够有效建模图像中的长程关系（long range dependency），简化目标检测的pipeline，构建端到端的目标检测器。 objection detection可以理解为一个集合预测任务（预测一个边界框和分类标签的集合），现有的目标检测算法的流程需要在大量proposals/anchors上定义回归和分类任务，DETR则通过预测集合实现目标检测。优点：不需要预定义的先验anchor 不需要NMS的后处理策略增加transformer的编码结构通过前馈神经网络直接预测框的位置和类别缺点： DETR在大目标检测上性能是最好的，而小目标上稍差基于match的loss导致学习很难收敛，难以学到最优的情况本文结合论文和代码，逐一分析DETR的模块，DETR的模块主要有： backbone模块位置编码 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

Foodaily每日食品 · 锅圈的“毛肚自由”，给我看傻眼了

7 月前

云南新闻网 · 今年首个暴雨红色预警发布！本周，云南大部多雷电、暴雨、大风……

7 月前

保观 · 聚焦行业变革，把握行业脉络！2024年保观全新报告发布

2 月前

生信人 · 你信不信，结合临床的生信才能发更高

2 月前

锦观新闻 · 迈合村人山人海？全红婵最新发声：理智一点吧！

昨天