专栏名称: Datawhale

一个专注于AI领域的开源组织，汇聚了众多顶尖院校和知名企业的优秀学习者，聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner，和学习者一起成长。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

张俊林：OpenAI o1的价值意义及强化学习的Scaling Law

Datawhale · 公众号 · 科技自媒体 · 2024-09-15 22:50

主要观点总结

本文介绍了作者张俊林对新发布的OpenAI o1模型的看法和评价。他强调了OpenAI o1模型在提升大模型的逻辑推理能力方面的巨大进步，并分析了其与GPT 4o等其他模型的不同和重要性。此外，文章还涉及到了预训练Scaling Law的来源以及OpenAI o1提到的RL Scaling law。

关键观点总结

关键观点1: 作者对OpenAI o1模型的看法和评价

作者认为OpenAI o1模型是自GPT 4发布以来，基座大模型最大的进展，特别是在提升大模型的逻辑推理能力方面。他认为GPT 4o和o1是不同的大模型发展思路，而o1方向更根本且重要性更高。

关键观点2: OpenAI o1模型与GPT 4o的区别和重要性

作者提到GPT 4o在提升大模型的智力水平上还有不足，难以处理复杂任务，而OpenAI o1模型则主要探索大模型在AGI路上的潜力。他认为OpenAI未来计划中的两条线，即OpenAI o1和GPT 4o各有其内在逻辑和发展方向。

关键观点3: OpenAI o1模型的方法论

作者解释了OpenAI o1模型通过类似AlphaGo的Monte Carlo Tree Search（MCTS）搜索+强化学习的方法提升大模型的逻辑推理能力。他还提到了问题复杂性对模型推理成本的影响以及Prompt工程的消亡等问题。

关键观点4: 预训练Scaling Law和RL Scaling law的分析

作者分析了预训练Scaling Law的来源以及大模型能力来源与数据的关系。他认为随着数据规模的增长，新数据包含的新知识比例会降低，导致Scaling Law的减缓现象。对于逻辑推理能力的提升，他强调了合成数据和构造更多比例的逻辑推理数据的重要性。他还提到了OpenAI o1中提到的RL在训练和推理时的Scaling law特性。

文章预览

Datawhale推荐作者：张俊林，新浪新技术研发负责人蹭下热度谈谈 OpenAI o1 的价值意义及 RL 的 Scaling law。一、OpenAI o1 是大模型的巨大进步我觉得 OpenAI o1 是自 GPT 4 发布以来，基座大模型最大的进展，逻辑推理能力提升的效果和方法比预想的要好，GPT 4o 和 o1 是发展大模型不同的方向，但是 o1 这个方向更根本，重要性也比 GPT 4o 这种方向要重要得多，原因下面会分析。为什么说 o1 比 4o 方向重要？这是两种不同的大模型发展思路，说实话在看到 GPT 4o 发布的时候我是有些失望的，我当时以为 OpenAI 会优先做 o1 这种方向，但是没想到先出了 GPT 4o。GPT 4o 本质上是要探索不同模态相互融合的大一统模型应该怎么做的问题，对于提升大模型的智力水平估计帮助不大；而 o1 本质上是在探索大模型在 AGI 路上能走多远、天花板在哪里的问题，很明显第二个 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

南京日报 · 超115亿！哪吒“三昧真火”，在南京越烧越旺

10 小时前

南京日报 · 超115亿！哪吒“三昧真火”，在南京越烧越旺

10 小时前

歸藏的AI工具箱 · Perplexity放大招了，发布自己的Deep Research

昨天

歸藏的AI工具箱 · Perplexity放大招了，发布自己的Deep Research

昨天

烂板套利 · 拓维信息，藏不住了！

2 天前

烂板套利 · 拓维信息，藏不住了！

2 天前

新民晚报 · 阴雨中返校，阳光这天归来；知名地标改造进度如何？徐汇区这样更新；《哪吒2》票房破100亿元 | 新民早报[2025.2.14]

2 天前

新民晚报 · 阴雨中返校，阳光这天归来；知名地标改造进度如何？徐汇区这样更新；《哪吒2》票房破100亿元 | 新民早报[2025.2.14]

2 天前

爱平度 · 实力“吸睛”！上级媒体聚焦平度！原因是→

3 天前

爱平度 · 实力“吸睛”！上级媒体聚焦平度！原因是→

3 天前

国关国政外交学人 · 【暑期夏令营】 2024年暨南大学第九届“东南亚、华侨华人与区域国际关系”夏令营招生启事

8 月前

跨通SHE · 石头科技强势登顶，湖南理工男干出个全球第一

4 月前

板鸭生活通 · “缘”来你在这里！

3 月前