专栏名称: CVer
一个专注侃侃计算机视觉方向的公众号。计算机视觉、图像处理、机器学习、深度学习、C/C++、Python、诗和远方等。
今天看啥  ›  专栏  ›  CVer

LSTM杀入视觉!Vision-LSTM:全新的通用视觉主干!

CVer  · 公众号  ·  · 2024-06-08 23:59
    

文章预览

点击下方 卡片 ,关注“ CVer ”公众号 AI/CV重磅干货,第一时间送达 重磅!端午节特惠!CVer学术星球最大优惠! 赠送 新用户 50元 优惠券 (下方左图), 老用户7折+ 20元 续费券 (下方右图),每天分享最新最优质的AI/CV内容,涨点idea非常多,最强助力你的科研和工作!还没加入/续费的同学快扫码加入! 转载自:机器之心 | 编辑:鸭梨、蛋酱 与 DeiT 等使用 ViT 和 Vision-Mamba (Vim) 方法的模型相比,ViL 的性能更胜一筹。 AI 领域的研究者应该还记得,在 Transformer 诞生后的三年,谷歌将这一自然语言处理届的重要研究扩展到了视觉领域,也就是 Vision Transformer。后来,ViT 被广泛用作计算机视觉中的通用骨干。 这种跨界,对于前不久发布的 xLSTM 来说同样可以实现。最近,享誉数十年的 LSTM 被扩展到一个可扩展且性能良好的架构 ——xLSTM,通过指数门控和可并行 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览