专栏名称: 将门创投

将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

MoA：混合稀疏注意力加速长文本生成，实现最高8倍吞吐率提升

将门创投 · 公众号 · 科技创业 · 2024-11-08 08:22

文章预览

随着大语言模型在长文本场景下的需求不断涌现，其核心的注意力机制（Attention Mechanism）也获得了非常多的关注。注意力机制会计算一定跨度内输入文本（令牌，Token）之间的交互，从而实现对上下文的理解。随着应用的发展，高效处理更长输入的需求也随之增长[1][2]，这带来了计算代价的挑战：注意力高昂的计算成本和不断增长的键值缓存（KV-Cache）代价。稀疏注意力机制可以有效缓解内存和吞吐量的挑战。然而，现有稀疏注意力通常采用统一的稀疏注意力模式，即对不同的注意力头和输入长度应用相同的稀疏模式。这种统一的方法难以捕捉到大语言模型中多样的注意力模式，导致不同注意力头的不同的精度-代价权衡被忽略。最近，来自清华大学、无问芯穹和上海交通大学的研究团队发表了《MoA: Mixture of Sparse Attention for Automatic Large Language Mo ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

课题指南针 · 本周六晚7点直播：国自然里面哪些“不好”但并非“不对”的坑或者注意事项

2 天前

化工平头哥 · 山东如何实现2025年石化产业发展目标？

3 天前

科技日报 · 我国正研发六足登月机器人！

3 天前

科技日报 · 我国正研发六足登月机器人！

3 天前

美股研究社 · 90亿美元！“AI搜索新贵”Perplexity今年第四次融资

6 天前

美股研究社 · 90亿美元！“AI搜索新贵”Perplexity今年第四次融资

6 天前

IPO早知道 · 联想集团第二财季净利润同比增长48%：AI PC产品销售呈现超预期表现

6 天前

第一教育 · 2024年6月上海市普通高中学业水平合格性考试成绩明日公布！

3 月前

斌叔OKmath · Phi 开始使用 MoE！ @Microsoft刚刚发布了 Ph-20240821093002

3 月前

广州番禺发布 · 基础运价不变，平峰期打车可打折！广州“打的”实施浮动运价

2 周前