OpenAI o1: 合成数据与推理搜索

RandomGenerator · 公众号 · · 2024-09-14 17:13

文章预览

趁着昨天 OpenAI o1 的发布，难得从每日忙碌的产品研发中抽出点时间来，学习跟进一下最近非常火热的 LLM 新范式。背景简介首先推荐阅读一下拾象的《 LLM 的范式转移：RL 带来新的 Scaling Law 》，很好地科普了一下基于 RL 的新 LLM scaling 范式。之前我们常说的 scaling law 一般指的是 pre-train 阶段通过算力、数据、模型参数量的提升来不断提升模型智能水平。不过最近一年来看，碰到了不少瓶颈：算力上我们受限于超大规模训练集群的各种工程挑战，例如 LLaMA 3 的 paper 里就提到他们的万卡集群每两小时就会有坏卡问题出现，所以进一步拓展到 10 万卡规模的集群目前看起来难度很大。数据方面，文本数据达到 10-20T token 量级后，需要进一步在数量级上提升目前也比较困难了。尤其是能带来“增量收益”的复杂推理方面的数据更加稀缺。所以大家普遍有 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

知乎日报 · 有什么东西是外国人吃，而中国人不吃的？

昨天

知乎日报 · 梁文锋参与发表的 DeepSeek 新论文，会带来哪些影响？

2 天前

知乎日报 · 知乎直答接入 DeepSeek，有哪些亮点？

3 天前

白帽子左一 · 记一次微信小程序逆向

7 月前

同城迪拜 · 2024年沙特运动会圣火传递活动启动;沙特房产融资新合作启动;沙特第94届国庆日主题揭晓;沙特将举办PFL“巨人之战”锦标赛

6 月前

金科应用研院 · 模型面试题：如何做数据清洗工作？（80%可能性提问）

5 月前