来自@GoogleDeepMind、 @Intel和@Georg-20240822080504

斌叔OKmath · 微博 · · 2024-08-22 08:05

文章预览

2024-08-22 08:05 本条微博链接来自 @GoogleDeepMind 、 @Intel和 @GeorgiaTech的 Wild Paper 无需乘法的 LLM 训练 - 将 OPT-66B 和 LLaMA-2-70B 模型的内存使用量减少 80% 以上。问题🔍 ：现有的 LLM 效率方法仍然依赖于昂贵的乘法，而重新参数化技术通常需要重新训练或大量微调。本文的解决方案🛠️ ： - ShiftAddLLM 为 LLM 引入了训练后移位和添加重新参数化。 - 重新参数化：用两个更简单的运算代替乘法： 👉移位：例如将小数点向左或向 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

普象工业设计小站 · 可爱炸了！日本街头惊现巨型秋田犬，裸眼3D就是牛！

20 小时前

普象工业设计小站 · 在贵州吃过一次红肉，人生当场就定格了

20 小时前

顶尖文案TOPYS · 太好了，我们有救了，总算有款听得懂人话的AI了

4 天前

工业水处理 · 巴安水务退市成定局！将从深交所摘牌

3 月前

能见 · 中国电气装备集团再现并购重组

3 月前