LeCun直言：ViT速度慢且效率低，实时图像处理还得看卷积！

CVer · 公众号 · · 2024-06-01 23:59

文章预览

点击下方卡片，关注“ CVer ”公众号 AI/CV重磅干货，第一时间送达点击进入—> 【Mamba/扩散/多模态】交流群添加微信：CVer5555，小助手会拉你进群！扫描下方二维码，加入CVer学术星球！可以获得最新顶会/顶刊上的论文idea 和 CV从入门到精通资料，及最前沿应用！发论文/搞科研/涨薪，强烈推荐！转载自：机器之心 | 编辑：泽南、杜伟用卷积能做出一样好的效果。在 Transformer 大一统的时代，计算机视觉的 CNN 方向还有研究的必要吗？今年年初，OpenAI 视频大模型 Sora 带火了 Vision Transformer（ViT）架构。此后，关于 ViT 与传统卷积神经网络（CNN）谁更厉害的争论就没有断过。近日，一直在社交媒体上活跃的图灵奖得主、Meta 首席科学家 Yann LeCun 也加入了 ViT 与 CNN 之争的讨论。这件事的起因是 Comma.ai 的 CTO Harald Schäfer 在展示自家最新研究。他（ ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

壹心理 · 最摧毁婚姻的不是贫穷、不是无性，而是这4个字

8 月前

隔壁班学习园地 · 把《黑神话：悟空》写进申论

5 月前

羊羊的地理教室 · 祝福祖国！75岁生日快乐！

4 月前

星涛投资 · 2008年巴菲特与埃默里与奥斯汀大学商学院学生在伯克希尔总部的问答

4 月前

NE时代新能源 · 【NE数据】2024年11月智驾域控及芯片装机量：德赛进击海外，地平线赋能萤火虫

1 月前