文章预览
点击上方 ↑↑↑ “ OpenCV学堂 ”关注我 来源:公众号 新智元 授权 【导读】 近日,深度学习三巨头之一的Yoshua Bengio,带领团队推出了全新的RNN架构,以大道至简的思想与Transformer一较高下。 在Transformer统治的AI时代之下, 散落在世界各地的「RNN神教」信徒,一直相信并期待着RNN回归的那天: 毕竟,凭借强大的顺序和上下文感知能力,RNN曾在各种任务中表现惊艳。 直到后来遭遇了反向训练的瓶颈,因Scaling Law而跌落神坛。 然而,人们并没有忘记RNN。 RWKV、Mamba、xLSTM等RNN衍生模型接连出现,欲挑战Transformer之霸主地位。 就在近日,又有重量级人物下场—— 深度学习三巨头之一的Yoshua Bengio,带领团队推出了全新的RNN架构,以大道至简的思想与Transformer一较高下。 论文地址:https://arxiv.org/pdf/2410.01201v1 研究人员对传统的两种RNN架构LSTM和GRU,进行了
………………………………