Meta新研究挑战CV领域基操：ViT根本不用patch，用像素做token效果更佳

FightingCV · 公众号 · · 2024-07-13 09:00

文章预览

关注“ FightingCV ”公众号回复“ AI ”即可获得超100G人工智能的教程点击进入→ FightingCV交流群来源：新智元仅用于学术分享，若侵权请联系删除正如token是文本处理的基本单位，patch也被默认是计算机视觉领域处理图像的基本单位。从CNN诞生，到结合Transformer架构的ViT，虽然模型架构发生了很大的变化，但有一点始终一致—— 研究人员们都会把原始图像先进行切割，模型输入以patch作为基本单位。这种预处理方法非常有效，因此有广泛的影响力，几乎主导了整个CV领域。甚至于，Sora等视频生成模型也沿用了这种方法。 Sora技术报告，训练时将视觉数据切割为patch 然而，Meta AI和阿姆斯特丹大学最近联合发表了一篇文章，对这个CV领域的「基操」提出了有理有据的质疑：图像切成patch，真的有必要吗？ https://arxiv.org/abs/2406.09415 首先我们可以做一 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · 回复@这是BLACK:看生成结果的质量，看是否能遵循你的指令，看-20241113044553

2 天前

我是腾腾爸 · 更极端了！

2 天前

华创食饮 · 【华创食饮|白酒】贵州茅台：分红承诺兑现，重申价值布局

3 天前

华创食饮 · 【华创食饮|白酒】贵州茅台：分红承诺兑现，重申价值布局

3 天前

铅笔道 · 投资300亿！这个赛道杀出一批潜力独角兽：与算力产业有关

6 天前

购机帮你评 · 起猛了，不到3600元就能买！苹果新Mac mini竟也有了高性价比？

6 天前

购机帮你评 · 起猛了，不到3600元就能买！苹果新Mac mini竟也有了高性价比？

6 天前

昆明信息港 · 转需！云南新一批招聘公告来了→

3 月前

兴业研究 · 宏观市场 | 宏观一周：粗钢产量降至同期新低

2 月前