文章预览
OpenAI 在 9 月 13 日发布的 o1-preview 模型后,o1 系列凭借其强大推理能力和解决问题能力得到大家广泛关注。 有业内人士表示,o1 开创了“强化学习的 Scaling Laws”,即“Inference Law”,算力收益要比训练获得的大得多。 对 Inference 系统 1(快思考)和系统 2(慢思想)的讨论一时间成为业内探讨的热点,而该理论正是出自诺贝尔经济学奖得主 Daniel Kahneman 的著作《思考,快与慢》。 英伟达高级科学家 Jim Fan 在 o1 发布后第一时间表示,大量计算将被转移到服务推理而不是训练前/后,o1 将成为数据飞轮,反过来将进一步优化 GPT 未来版本的推理核心。 周鸿祎对 OpenAI 的前瞻性解读 OpenAI o1-preview 在产品中应用 Inference 的背后,正是通过“思维链(CoT)”实现的。基于强化学习,o1 将棘手的问题分解为更简单的步骤,再交给多个子模型来解决,从而提高模型的
………………………………