文章预览
作者 | 我爱计算机视觉 编辑 | 极市平台 点击下方 卡片 ,关注“ 自动驾驶Daily ”公众号 戳我-> 领取近15个自动驾驶方向路线 >> 点击进入→ 自动驾驶Daily技术交流群 微信扫描以下二维码,加入【自动驾驶之心】知识星球, 国内最专业的技术和求职交流社区, 和3500人一起卷赢 导读 本文介绍了一种新型的通用视觉主干网络TransXNet,它通过引入Dual Dynamic Token Mixer(D-Mixer)模块,融合了全局和局部动态性,显著提升了模型对多尺度特征的动态表征能力,并在多个数据集上展现出卓越的性能。 本篇分享论文 TransXNet: Learning both global and local dynamics with a dual dynamic token mixer for visual recognition ,通用的视觉Backbone,TransXNet: 全局动态性+局部动态性=性能强大,代码已开源! 论文链接: https://arxiv.org/abs/2310.19380 (预印版) 代码链接: https://github.com/LMMMEng/Trans
………………………………