港大北航等1bit大模型引热议，IEEE刊物评“解决AI能源需求”！作者亲自解读在此

量子位 · 公众号 · AI · 2024-06-09 14:14

文章预览

BiLLM团队发自凹非寺量子位 | 公众号 QbitAI 极限量化，把每个参数占用空间压缩到1.1bit ！ IEEE Spectrum专栏，一种名为 BiLLM 的训练后量化（PTQ）方法火了。通俗来讲，随着LLM参数规模越来越大，模型计算的内存和资源也面临着更大的挑战。如何把模型变得小巧经济实惠，能塞进手机等设备中？ BiLLM解决的正是这样的一个问题。它使用1bit来近似网络中的大多数参数，使用2bit来表示一些对性能最有影响的权重。实验测试中，研究人员对OPT模型、Llama系列进行了二值化。在OPT模型家族上，BiLLM以1.1bit的平均权重大小实现了目前最极限的LLM训练后压缩；在Llama系列模型上，BiLLM在1.08bit下的表现甚至超过了使用全精度的OPT-66B模型。效率方面，BiLLM能够在单个GPU上半小时内完成7B LLM的二值化。 BiLLM发布当天，便引发了网友对大模型优化的热议，有网友就表 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【Even Demo：一个演示应用程序，用于展示与智能眼镜配合的-20241214165614

4 天前

爱可可-爱生活 · [LG]《Does Representation Matter?-20241214061023

4 天前

量子位 · 「AI定义汽车」新拐点已至！小米孟二利：我们有三个工作需要做好 | MEET 2025

5 天前

宝玉xp · claude.ai 的Artifacts 真的很好用//@bru-20241213020347

5 天前

爱可可-爱生活 · 「AI说：对话的背后到底是什么？」当我们说“对话”时，究竟是什么-20241212213434

5 天前

深圳教师招聘帮 · 深圳市文理实验学校（集团）文理一小教师招聘公告【南山教师招聘】

1 月前

小胖看房二手房 · 粉丝房源无中介！嘉定嘉定新城嘉德豪庭89.14平3房399万

1 月前