清华稀疏Attention，无需训练加速一切模型！

数据派THU · 公众号 · 大数据 · 2025-04-18 17:00

文章预览

来源：人工智能前沿讲习本文约1700字，建议阅读 6分钟本文从前言，挑战，方法，以及实验效果四个方面介绍 SpargeAttn。为了进一步加速 Attention，清华大学陈键飞团队进一步提出了无需训练可直接使用的稀疏 Attention（SpargeAttn）可用来加速任意模型。实现了4-7 倍相比于 FlashAttention 的推理加速，且在语言，视频、图像生成等大模型上均保持了端到端的精度表现。论文标题：SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference 论文链接： https://arxiv.org/abs/2502.18137 开源代码： https://github.com/thu-ml/SpargeAttn 下图展示了 SpargeAttn 的速度，可以发现在 RTX4090 上，SpargeAttn 在 60% 稀疏度的情况下可以达到 900TOPS 的速度，甚至是使用 A100 显卡速度的 4.5 倍（A100 上 FlashAttention 只有 200TOPS）。在 SpargeAttn 的 Github 仓库中可以发现，SpargeAttn 的使用方法比较简洁 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

数据派THU · 【博士论文】强化学习智能体的奖励函数设计

昨天

国家数据局 · 2024年“数据要素×”大赛优秀项目案例集——绿色低碳案例之十 | 供热数据产品实践化促进能源产业链数字化转型升级

2 天前

国家数据局 · 2024年“数据要素×”大赛优秀项目案例集——绿色低碳案例之十 | 供热数据产品实践化促进能源产业链数字化转型升级

2 天前

今日家居FurnitureToday · 美克家居、梦天家居、梦百合、帝欧家居、亚振家居、惠达卫浴、Habit 栖息地等最新消息

11 月前

FE图南工作室 · 瑞士洛桑联邦理工学院Nano Lett.: V掺杂HfO2：一种具有高耐疲劳特性且展现负电容效应的铁电薄膜！！

2 月前