专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

张俊林：Grok 3是否意味着大力出奇迹的大模型法则仍然成立？

AINLP · 公众号 · · 2025-02-20 10:00

文章预览

媒体风向变化太快，让人目不暇接。早上还在夸Deepseek成本低，性价比高，预训练Scaling Law死了，不需要太多机器和GPU卡，性价比优先，英伟达休矣；中午Grok 3一出来，说是用了10万张英伟达H100卡，效果力压OpenAI o3 mini和Deepseek R1，就转向说Scaling law还成立，还需要大量的卡，英伟达股价有救了，还是要大力出奇迹…… 知乎：https://zhuanlan.zhihu.com/p/24609799526 这两个观点明显对立，有一真必有一假，那事实的真相到底是啥呢？我们来推一推。一. 预训练阶段的Scaling Law是否仍然成立预训练阶段的Scaling Law成立吗？当然是成立的，所谓“Scaling Law撞墙”，大家普遍遇到的问题是数据不够了，没有大量新数据，导致预训练阶段的Scaling Law走势趋缓，注意是趋缓但不是停顿，预训练阶段的Scaling Law并没到天花板。按照Chinchilla Scaling Law推断，即使没有新数据，也并 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

深夜书屋 · 人生三大桌：出生时摆一桌；结婚时摆一桌；死的时候摆一桌。第一桌不会吃；第二桌没空吃；第三桌别人吃。真的，一桌也没吃到。好好珍惜现在拥有的生活，该吃吃，该喝喝，遇事别往心里搁！健康最重要！

昨天

深夜书屋 · 1、当你老了，你才悲哀的发现，你的儿女并没有想象中的那么孝顺。在他们眼里，他们自己的孩子和家庭比你更重要。你好像什么都不缺，又好像什么都没有，不知不觉间，已到不惑之年。所以你一定要记住，人生下半场，....

2 天前

老子道德经 · 够得着的幸福，才是你的（深度好文）

3 天前

英语播客党 · 英语播客｜美国堕胎与犯罪关系，罗诉韦德案｜Freakonomics Radio Podcast

3 月前

高分子科学前沿 · 江雷院士团队AFM：在蓝相液晶温度-时间依赖性动态图案的多墨水协同印刷技术方面取得新进展

3 天前