注册
登录
专栏名称:
量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
【Observers:一个面向AI可观测性的 ...
·
昨天
黄建同学
·
Runway 推出全新功能:Expand ...
·
2 天前
爱可可-爱生活
·
【PySpur:一款专注于推理计算流水线的集 ...
·
2 天前
宝玉xp
·
AI可以在设计好的工作流中充当重要角色,但是 ...
·
6 天前
黄建同学
·
#谷歌聊天机器人竟回复称人类去死吧##ai# ...
·
5 天前
今天看啥
›
专栏
›
量子位
今日最热论文:Scaling Law后继乏力,量化也不管用,AI大佬齐刷刷附议
量子位
·
公众号
·
AI
· 2024-11-13 14:54
文章预览
一水 发自 凹非寺 量子位 | 公众号 QbitAI 几十万人关注,一发表即被行业大佬评为“这是很长时间以来最重要的论文”。 哈佛、斯坦福、MIT等团队的一项研究表明: 训练的token越多,需要的精度就越高。 例如,Llama-3在不同数据量下 (圆形8B、三角形70B、星星405B) ,随着数据集大小的增加,计算最优的精度也会增加。 换句话就是,对于大规模的训练任务, 低精度的量化可能不再足够有效 。 按照结论,对Scaling Law的遵循意味着我们需要保持更高精度,然而一直以来,人们通常会选择量化 (将连续值或多精度值转换为较低精度) 来节省计算资源。 一旦结论成立,GPU的设计和功能可能也需要相应调整,因为传统上,GPU的性能提升部分依赖于对低精度计算的优化。 正如艾伦AI研究所科学家所指出的: 这是很长时间以来最重要的论文。 它用强有力的证 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
【Observers:一个面向AI可观测性的轻量级工具库,可以追-20241123153009
昨天
黄建同学
·
Runway 推出全新功能:Expand Video↓看完他的教-20241123125639
2 天前
爱可可-爱生活
·
【PySpur:一款专注于推理计算流水线的集成开发环境,让开发者-20241122200400
2 天前
宝玉xp
·
AI可以在设计好的工作流中充当重要角色,但是完全让AI负责整个工-20241119124215
6 天前
黄建同学
·
#谷歌聊天机器人竟回复称人类去死吧##ai# 确实有这个回复,一-20241119135326
5 天前
墨香中华
·
初秋,很美
3 月前
王腾Thomas
·
光谷世界城小米汽车融合店新店开业-20240901084511
2 月前
能源学人
·
Dong-Won Kim &赵家昌&毛剑锋:双功能Ca掺杂的层状δ-MnO2正极实现高倍率下1000圈稳定循环的水系锌离子电池
1 月前