注册
登录
专栏名称:
机器之心
专业的人工智能媒体和产业服务平台
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
黄建同学
·
#谷歌聊天机器人竟回复称人类去死吧##ai# ...
·
3 天前
爱可可-爱生活
·
【Sequin:一款帮助你调试命令行界面和文 ...
·
3 天前
爱可可-爱生活
·
今日推介(第1594期):1000名个体的生 ...
·
4 天前
爱可可-爱生活
·
[CL]《Counterfactual ...
·
5 天前
爱可可-爱生活
·
[LG]《Score-based ...
·
6 天前
今天看啥
›
专栏
›
机器之心
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
机器之心
·
公众号
·
AI
· 2024-11-13 13:23
文章预览
机器之心报道 作者:泽南、小舟 研究表明,你训练的 token 越多,你需要的精度就越高。 最近几天,AI 社区都在讨论同一篇论文。 UCSD 助理教授 Dan Fu 说它指明了大模型量化的方向。 CMU 教授 Tim Dettmers 则直接说:它是很长一段时间以来最重要的一篇论文。OpenAI 创始成员、特斯拉前 AI 高级总监 Andrej Karpathy 也转发了他的帖子。 Tim Dettmers 表示,可以说,人工智能的大部分进步都来自计算能力的提升,而(在最近)这主要依赖于低精度路线的加速(32- > 16 - > 8 位)。现在看来,这一趋势即将结束。再加上摩尔定律的物理限制,大模型的大规模扩展可以说要到头了。 例如,英伟达最新的 AI 计算卡 Blackwell 将拥有出色的 8 位能力,并在硬件层面实现逐块量化。这将使 8 位训练变得像从 FP16 切换到 BF16 一样简单。然而,正如我们从新论文中看到的那样,对 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
黄建同学
·
#谷歌聊天机器人竟回复称人类去死吧##ai# 确实有这个回复,一-20241119135326
3 天前
爱可可-爱生活
·
【Sequin:一款帮助你调试命令行界面和文本用户界面的小工具,-20241119140651
3 天前
爱可可-爱生活
·
今日推介(第1594期):1000名个体的生成式智能体仿真、非平-20241119061244
4 天前
爱可可-爱生活
·
[CL]《Counterfactual Generation f-20241118060432
5 天前
爱可可-爱生活
·
[LG]《Score-based generative diff-20241117070839
6 天前