专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

性能远超Mamba！北大林宙辰团队提出全新混合序列建模架构MixCon

PaperWeekly · 公众号 · 科研 · 2024-10-17 17:56

文章预览

©作者 | 林宙辰、徐鑫单位 | 北京大学来源 | 机器之心在自然语言处理、语音识别和时间序列分析等众多领域中，序列建模是一项至关重要的任务。然而，现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此，北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon，它为解决这些难题带来了创新性的方案。经实验验证，其性能远超 Mixtral、Mamba 和 Jamba。论文已在 European Conference on Artificial Intelligence (ECAI) 2024 上发表。论文标题： MixCon: A Hybrid Architecture for Efficient and Adaptive Sequence Modeling 论文链接： https://zhouchenlin.github.io/Publications/2024-ECAI-MixCon.pdf 现有序列建模模型的困境线性注意力Transformer 线性注意力 Transformer 旨在通过近似注意力机制来提高原始 Transformer 模型的效率，将计算复杂度从降低到或，但在处理长 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

募格学术 · 最新！这所新建大学公示，明年开始招收本科生

2 天前

社会学理论大缸 · 申请季最后冲刺，如何改出让导师心动的研究计划书？

4 天前

科研大匠 · Springer Nature推出适合投稿新手全新OA期刊：速度快，接收病例报告、数据说明等多种形式！

5 天前

小张聊科研 · 国自然申请|研究科研热点“代谢重编程”，国内外研究进展梳理

5 天前

自然系列 · 山东大学：将全球消费控制在行星边界预算内 |《自然》论文

6 天前

AIGC视界 · 火爆全网的AI造像，逼开发者祭出“火眼金睛”：让AI“完美”图片瞬间现原形，不料却秒翻车？

3 月前

Marine Sedimentology · Palaeo-3：深海环境中自生黄铁矿的形貌特征及其古海洋学意义——基于IODP 342航次U1406站位岩芯沉积物的研究

2 周前

Marine Sedimentology · Palaeo-3：深海环境中自生黄铁矿的形貌特征及其古海洋学意义——基于IODP 342航次U1406站位岩芯沉积物的研究

2 周前