文章预览
以下 文 章来源于微信公众号:集智书童 作者:小书童 链接:https://mp.weixin.qq.com/s/l_rI6F3VM-cOLSQ1ifQjIg 本文仅用于学术分享,如有侵权,请联系 后 台作删文处理 导读 Transformer不仅以其强大的性能开启了大模型时代,而且在与YOLO结合以后,同样对计算机视觉产生了重大影响。本文作者将Swin Transformer主干网与YoloR的Neck和Head结合,实现了比Swin Transformer更优的性能和更快的推理速度。 本文介绍了YotoR(You Only Transform One Representation),一种结合了Swin Transformers和YoloR架构的新型深度学习目标检测模型。在自然语言处理中具有革命性的Transformer技术,同样对计算机视觉产生了重大影响,提供了提高准确性和计算效率的潜力。 YotoR将健壮的Swin Transformer主干网与YoloR的 Neck 和 Head 结合在一起。 在作者的实验中,YotoR模型TP5和BP4在各项评估中一致优于YoloR P6和Swin Tran
………………………………