今天看啥  ›  专栏  ›  自动驾驶Daily

更深层的理解视觉Transformer, 对视觉Transformer的剖析

自动驾驶Daily  · 公众号  ·  · 2023-12-03 19:15
点击下方卡片,关注“自动驾驶Daily”公众号ADAS巨卷干货,即可获取>>点击进入→自动驾驶Daily技术交流群写在前面&&笔者的个人理解目前基于Transformer结构的算法模型已经在计算机视觉(CV)领域展现出了巨大的影响力。他们在很多基础的计算机视觉任务上都超过了之前的卷积神经网络(CNN)算法模型,下面是笔者找到的最新的在不同基础计算机视觉任务上的LeaderBoard榜单排名,通过LeaderBoard可以看到,基于Transformer算法模型在各类计算机视觉任务上的统治地位。图像分类任务首先是在ImageNet上的LeaderBoard,通过榜单可以看出,前五名当中,每个模型都使用了Transformer结构,而CNN结构只有部分使用,或者采用和Transformer相结合的方式。图像分类任务的LeaderBoard目标检测任务接下来是在COCO test-dev上的LeaderBoard,通过榜单可以看出,前五名当中,一半以上都 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照