NV大涨与RL自己的Scaling Law

共识粉碎机 · 公众号 · · 2024-09-12 17:51

文章预览

关注共识粉碎机，获取历史讨论会纪要昨天Jenson的GS小会内容引爆全场： whatever training ways: LLM/RAG/RL/Model Self Leaning/Pura scaling, compute intensity stll goes up! whatever it is, they are more demanding! 我们也第一次看到Jenson在公开场合承认Post-train的需求Super Strong，甚至已经看到了RL或者Post-train自己的Scaling Law。我们在过去一个多月的草莓与Post-train路演，以及9月5日《NV后面可能的路径》中，都反复提到不要相信陆家嘴小作文，Post-train需求非常强。 “post-train虽然参数没变，但是在训练算力上仍然会倍数增长，甚至最近两个月在post-train上也发现了Scaling Law；推理上也会随着模型“思考能力提高”，单次算力增长。”（9月5日原文）我们也不断在路演中讲到，比起之前用几行公式数学推导RL，RL在最近几个月已经走上了规模化暴力求解的路径，并且看到了明确的方向，RL ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

MiyueMedia · 做店铺的首图，差异化比图漂亮更重要！

16 小时前

MiyueMedia · 做店铺的首图，差异化比图漂亮更重要！

16 小时前

运营研究社 · 《小红书种草与转化实战手册》包邮送，真香！

22 小时前

运营研究社 · 2025怎么做小红书获客？| 闭门夜话会回顾

2 天前

商派 · 如何用深度运营破流量焦虑局？

2 天前

商派 · 如何用深度运营破流量焦虑局？

2 天前

91运营网 · 91运营网vip会员早鸟票抢座ing！!

2 天前

兴业研究 · 东南亚研究 | 2023年香港资管与财富市场分析

7 月前

谭谈债市 · 转债估值低点已过：9月转债策略组合

6 月前

盛和塾 · 稻盛和夫：只有把心态提升到这样的境界，才能在工作中取得辉煌的成功

2 月前

国家文物局 · “镕古铸新：宋元明清铜器特展”在美国大都会艺术博物馆开幕

2 周前