学术分享丨精度与通用性不可兼得，北大华为理论证明低精度下scaling law难以实现

中国人工智能学会 · 公众号 · AI · 2024-11-19 17:58

文章预览

转自机器之心本工作来自北京大学智能学院王立威、贺笛老师课题组与华为诺亚方舟实验室李震国、孙嘉城研究员。作者包括智能学院博士生冯古豪、古云天、罗胜杰；信息科学技术学院本科生杨铠、艾心玥。大模型量化通过将模型参数从较高的精度（如 bfoat16）压缩到低精度（如 int8 或 int4）来降低模型推理的开销，提高模型推理的速度。在大语言模型的实际部署中，量化技术能够显著提高大语言模型推理的效率。但近日，来自哈佛大学，MIT，CMU，斯坦福大学和 Databricks 的研究团队通过大量实验总结出了大语言模型关于精度的 Scaling Law，实验发现模型的量化压缩会较大影响大语言模型的性能。无独有偶，来自北大和华为的研究团队近期则从理论角度研究了量化对于大模型通用性的影响。具体而言，研究者关注了量化对于大模型数学推理能力的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 《爱可可微博热门分享(2.4)》爱可可微博热门分享(2.4)-20250204223935

13 小时前

爱可可-爱生活 · 【[130星]Airweave：将任意应用转化为Agent的知识-20250204153221

20 小时前

新智元 · DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪

4 天前

浙江公安 · “蛇”警官的新年愿望竟然是……

4 天前

浙江公安 · “蛇”警官的新年愿望竟然是……

4 天前

宝玉xp · 应该只是系统故障，现在已经恢复了-20250131020209

5 天前

左右为篮 · 黑丝长腿，当年就爱守着电脑，看她直播！

7 月前

东岸爵士俱乐部 · 今晚9:30PM【刘玥爵士三重奏】&大师来Jam！

3 月前

三联生活周刊 · 哪怕要在雪场“随地大小班”，我们为何还是那么爱滑雪？

1 月前