作为沟通学习的平台,发布机器学习与数据挖掘、深度学习、Python实战的前沿与动态,欢迎机器学习爱好者的加入,希望帮助你在AI领域更好的发展,期待与你相遇!
今天看啥  ›  专栏  ›  机器学习算法与Python学习

MLP回归,无需卷积、自注意力,纯多层感知机视觉架构媲美CNN、ViT

机器学习算法与Python学习  · 公众号  ·  · 2021-05-08 15:40
点击 机器学习算法与Python学习 ,选择加星标精彩内容不迷路机器之心报道当前,卷积神经网络(CNN)和基于自注意力的网络(如近来大火的 ViT)是计算机视觉领域的主流选择,但研究人员没有停止探索视觉网络架构的脚步。近日,来自谷歌大脑的研究团队(原 ViT 团队)提出了一种舍弃卷积和自注意力且完全使用多层感知机(MLP)的视觉网络架构,在设计上非常简单,并且在 ImageNet 数据集上实现了媲美 CNN 和 ViT 的性能表现。计算机视觉的发展史证明,规模更大的数据集加上更强的计算能力往往能够促成范式转变。虽然卷积神经网络已经成为计算机视觉领域的标准,但最近一段时间,基于自注意力层的替代方法 Vision Transformer(ViT)实现新的 SOTA 性能。从技术上讲,ViT ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照