专栏名称: 智驾实验室
欢迎关注“智驾实验室”!本公众号专注于自动驾驶领域,为您带来世界模型的最新研究,多模态大模型的深入解析,以及多模态大模型在自动驾驶领域的应用与落地。在这里,您可以了解到自动驾驶技术的最新动态,洞察行业趋势,与我们一起探索未来出行的无限可能。
今天看啥  ›  专栏  ›  智驾实验室

YotoR | 融合 Swin Transformer 和YoloR 的混合架构,提升目标检测性能的新前沿 !

智驾实验室  · 公众号  ·  · 2024-06-07 11:21
    

文章预览

点击下方卡片,关注 「集智书童」 公众号 点击加入👉 「集智书童」 交流群 本文介绍了YotoR(You Only Transform One Representation),一种结合了Swin Transformers和YoloR架构的新型深度学习目标检测模型。在自然语言处理中具有革命性的Transformer技术,同样对计算机视觉产生了重大影响,提供了提高准确性和计算效率的潜力。 YotoR将健壮的Swin Transformer主干网与YoloR的 Neck 和 Head 结合在一起。 在作者的实验中,YotoR模型TP5和BP4在各项评估中一致优于YoloR P6和Swin Transformers,比Swin Transformer模型实现了更优的目标检测性能和更快的推理速度。 这些结果突显了通过Transformer进一步模型组合和改进实时目标检测的潜力。 论文最后强调了YotoR的更广泛意义,包括其增强基于Transformer的模型用于图像相关任务的可能性。 1 Introduction 卷积神经网络在过去十年中彻底改变了计算 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览