专栏名称: 智猩猩Auto
聚焦智能汽车关键技术与创新产品
今天看啥  ›  专栏  ›  智猩猩Auto

地平线Vision Mamba:超越ViT,最具潜力的下一代通用视觉主干网络

智猩猩Auto  · 公众号  ·  · 2025-01-05 19:54
    

文章预览

大会预告 1月14日,第四届全球自动驾驶峰会 将在北京举办。分会场上午进行的 自动驾驶视觉语言模型技术研讨会 上,中国科学院自动化研究所多模态人工智能系统全国重点实验室助理研究员戴星原,上海人工智能实验室青年研究员、香港大学博士生司马崇昊,华中科技大学Hust Vision Lab与地平线联合培养博士生蒋博,香港中文大学MMLab在读博士邵昊将进行主题报告。欢迎申请免费票或购票~ 本文来自地平线投稿,作者廖本成。 CNN和Transformer常作为深度学习模型的首选基础模块,被应用于各种场景,如文本、视觉、语音信号处理及其各种下游应用。然而这两个基础模块都有着其固有而互补的缺陷:CNN具有固定大小窗口的卷积核,使其计算量为线性,但也由此而面临着窗口化局部感受野的缺陷,使其在全局场景感知和场景语义理解上乏力,Transformer通过全局的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览