专栏名称: 江大白
专业有趣的AI内容平台,关注后回复【算法】,获取45家大厂的《人工智能算法岗江湖武林秘籍》
今天看啥  ›  专栏  ›  江大白

万字长文,大模型神经网络量化,推倒万亿参数大模型内存墙!

江大白  · 公众号  ·  · 2024-07-10 08:00

文章预览

以下 文 章来源于微信公众号: 新智元 作者: 新智元 链接:https://mp.weixin.qq.com/s/sVtb3FYtKsbG1GHbFgIvWg 本文仅用于学术分享,如有侵权,请联系 后 台作删文处理 导读 随着大模型技术的兴起,我们正处于一个崭新的智能时代的黎明。 为了应对万亿参数大模型内存墙,使用量化技术是必不可少的。本文以万字长文方式,从第一性原理解释神经网络量化过程,值得点赞收藏! 从32位,到16位,再到8位,量化在加速神经⽹络⽅⾯发挥了巨⼤作⽤。 放眼一看,世界把所有的⽬光都聚焦在数字格式上。因为在过去的⼗年中,AI硬件效率的提⾼有很⼤⼀部分要归功于数字格式。 较低精度的数字格式,帮助推倒了数十亿参数模型的内存墙。 英伟达声称,过去10年,单芯⽚TOPS提升了足足1000倍,英伟达自身就加起来达16倍。相⽐之下,从28nm到5nm,⼯艺技术的改进仅为 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览