手机跑大模型提速4-5倍！微软亚研院开源新技术，有CPU就行

量子位 · 公众号 · AI · 2024-08-09 12:40

文章预览

微软亚洲研究院投稿量子位 | 公众号 QbitAI 有CPU就能跑大模型，性能甚至超过NPU/GPU！没错，为了优化模型端侧部署，微软亚洲研究院提出了一种新技术—— T-MAC 。这项技术主打性价比，不仅能让端侧模型跑得更快，而且资源消耗量更少。咋做到的？？在CPU上高效部署低比特大语言模型一般来说，要想在手机、PC、树莓派等端侧设备上使用大语言模型，我们需要解决存储和计算问题。常见的方法是模型量化，即将模型的参数量化到较低的比特数，比如4比特、3比特甚至更低，这样模型所需的存储空间和计算资源就会减少。不过这也意味着，在执行推理时，需要进行混合精度的矩阵乘法运算（mpGEMM），即用低精度的权重和高精度的激活向量进行计算。然而，现有的系统和硬件并不原生支持这种混合精度的矩阵乘法，因此它们通常需要将低 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · //@苏倩的烦恼:研发做出来未面市的可以叫产品，然后是“商品”，-20241106063100

昨天

宝玉xp · //@前行哲:不错，beta版免费-20241105120826

昨天

新智元 · UCLA、MIT数学家推翻39年经典数学猜想！AI证明卡在99.99%，人类最终证伪

2 天前

十字路口Crossing · NotebookLM刷屏后，我们总结了10个用法并重新回答一个老问题：AI如何影响内容？

6 天前

十字路口Crossing · NotebookLM刷屏后，我们总结了10个用法并重新回答一个老问题：AI如何影响内容？

6 天前

量子位 · 帮了一把南美农民的拼多多，联合国粮农组织都点赞了

6 天前

微讯江苏 · 首次参加残奥会即夺冠！江苏小将蔡秉辰勇夺男子铅球F33级金牌

1 月前