专栏名称: 量子位

վ'ᴗ' ի 追踪AI行业和技术动态，这里更快一步！关注我们，回复“今天”，更多大新闻等你来发现

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

姚期智团队开源新型注意力，节省90%内存不降性能，一个框架统一MHA/MQA/GQA

量子位 · 公众号 · AI · 2025-01-15 16:56

主要观点总结

文章介绍了新型注意力机制TPA，由姚期智院士团队打造。TPA对每个token做动态的张量分解，不存储完整的静态KV，内存占用可节省90%以上而不会牺牲性能。论文统一了现代注意力设计，新模型T6的代码已在GitHub开源。

关键观点总结

关键观点1: 新型注意力机制TPA的介绍

TPA是对每个token做动态的张量分解，不存储完整的静态KV，通过保留分解的版本，大幅度降低内存占用。

关键观点2: TPA的性能优势

TPA能够大幅度降低内存占用，同时不会牺牲性能。论文证明了流行的MHA、MQA、GQA都是TPA的特殊情况，用同一框架统一了现代注意力设计。

关键观点3: TPA的实验结果

使用新方法训练的模型T6已经在GitHub上开源。论文发布后，有创业者和研究人员表示对TPA的看好，并期待看到更多实验结果。

关键观点4: TPA与其他方法的对比与优势

现有的注意力机制存在计算和内存开销大的缺陷，DeepSeek-v2中的MLA虽然压缩了KV缓存，但与RoPE位置编码不兼容。而TPA能够无缝集成RoPE位置编码，实现以较低的成本旋转分解KV。

关键观点5: 研究团队与合作

论文由清华 & 上海期智研究员团队、UCLA顾全全团队合作。共同一作为清华博士生张伊凡与姚班校友、现UCLA博士生刘益枫，还有来自心动网络Taptap的Qin Zhen参与研究。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

爱可可-爱生活 · 【[42星]RLRoverLab：一个用于行星探测车模拟和训练的-20250702135512

22 小时前

宝玉xp · 苹果或将弃用自家AI技术，考虑采用Anthropic或OpenA-20250701214739

昨天

AI产品阿颖 · 2025 年过半，我斗胆从自己的视角，聊下当前几个头部模型的进展。1、OpenAI 依然领跑。从 o3 到 o3 pro，以及 7 月即将到来的 GPT-5，他们产品节奏稳定，用户量还在持续增长中。而且 OpenAI 还组建了单独的应用事业部。整体看，这家公司仍然是 AI 领域的王者。2、Anthropic 另辟蹊径，打造了编程领域最强大的模型。如他们 CEO 所说，接下来他们的目标是把所有研发流程全都交给 Agent 自动完成。目前，Anthropic 的重点是 B 端市场，核心方向是编程和写作。3、

昨天

爱可可-爱生活 · 【[59星]awesome-isaac-sim：NVIDIA I-20250701135227

昨天

爱可可-爱生活 · 【[25星]awesome-bfm-papers：行为基础模型（-20250701135510

昨天

t0mbkeeper · dǎ dù déi nǎ nù néi yǐ dà yǐ dà-20240703134137

12 月前

跨境电商鹰熊汇 · 跨境电商活动计划（报名通道）

10 月前

媒哥媒体招聘 · 上海戏剧学院招聘！

8 月前

青岛新闻综合广播FM1076 · 大反转！即将影响青岛！

3 月前

都市现场 · 南昌⇆泉州！这趟周末假日旅游列车开通

2 月前