LSTM杀入视觉！Vision-LSTM：全新的通用视觉主干！

CVer · 公众号 · · 2024-06-08 23:59

文章预览

点击下方卡片，关注“ CVer ”公众号 AI/CV重磅干货，第一时间送达重磅！端午节特惠！CVer学术星球最大优惠！赠送新用户 50元优惠券 (下方左图)，老用户7折+ 20元续费券 (下方右图)，每天分享最新最优质的AI/CV内容，涨点idea非常多，最强助力你的科研和工作！还没加入/续费的同学快扫码加入！转载自：机器之心 | 编辑：鸭梨、蛋酱与 DeiT 等使用 ViT 和 Vision-Mamba (Vim) 方法的模型相比，ViL 的性能更胜一筹。 AI 领域的研究者应该还记得，在 Transformer 诞生后的三年，谷歌将这一自然语言处理届的重要研究扩展到了视觉领域，也就是 Vision Transformer。后来，ViT 被广泛用作计算机视觉中的通用骨干。这种跨界，对于前不久发布的 xLSTM 来说同样可以实现。最近，享誉数十年的 LSTM 被扩展到一个可扩展且性能良好的架构 ——xLSTM，通过指数门控和可并行 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

哎咆科技 · 终于，iOS 19 将带来分屏和电脑模式！

昨天

ZOL中关村在线 · iPhone 17系列机模曝光：三种设计方案详细解析

昨天

EETOP · 年薪:100-150万招聘高级模拟ic设计工程师

昨天

EETOP · 经典资料：复旦大学 CMOS 模拟集成电路设计讲义

2 天前

EETOP · 国产EDA PyAether生态征集活动正式开启！丰厚奖励等您来

2 天前

李银河 · 从哲学的意义上，人应当过一种无目的的生活

5 月前

sundanjian · 高中物理知识点总结，98页！

1 月前

重庆晨报 · 本周末，重庆部分区域交通管制！

1 月前