王小川评OpenAI o1: 找到一条从快思考走向慢思考的路

腾讯科技 · 公众号 · 科技媒体 · 2024-09-25 00:00

主要观点总结

本文是对腾讯新闻《潜望》关于OpenAI新模型o1的报道的总结，涉及o1模型的特点、技术原理、应用前景以及国内相关技术和市场情况的讨论。

关键观点总结

关键观点1: o1模型的特点和发布背景

o1模型是OpenAI发布的新的语言模型，它代表了AI领域的一个大转移或升级。该模型通过强化学习实现了思维链（CoT），提高了泛化能力。

关键观点2: 关于强化学习的讨论

强化学习是o1模型的核心技术之一，它与监督学习不同，强调在互动中学习。强化学习分为两个阶段：思考和行动，先思考再行动，以提高智能水平。专家预测强化学习将在医疗等领域发挥重要作用。

关键观点3: 国内技术和市场情况的对比

国内大模型创业公司正在追赶国际先进技术，但仍然存在差距。大模型创业公司的竞争压力来自于资金和人才储备的积累以及市场需求的增长。专家预测大模型创业公司的竞争将非常激烈，但至少有一家公司能够存活下来。

关键观点4: 百川智能的策略和目标

百川智能重视强化学习领域的研究，并已经在医疗等领域取得了一些进展。公司的目标是在知识领域打造数字员工，最终目标是实现生命的数学模型。百川智能计划通过供给驱动的方式推动技术进步和产品发展。

文章预览

主笔：张小珺编辑：石丁出品：腾讯新闻《潜望》 2024年9月，OpenAI预热已久的“Strawberry”（草莓）项目终于问世，它重置命名模式，没有沿用原有的GPT命名，而是取名为o1模型——业界认为，o1代表了AGI范式的一次大转移或者大升级。在靠语言模型预训练的Scaling Law这个经典物理规律遇到瓶颈后，包括OpenAI在内的多家硅谷明星公司，已经把它们的资源重心押宝在一条新路径上：强化学习。o1的发布把以强化学习为基础的后训练，推到了焦点中心。百川智能创始人兼CEO王小川很早就开始在公开演讲中谈论强化学习。他曾说，大模型代表快思考，它叫“学”；强化学习是慢思考，叫“思”。“学”和“思”两个系统最终会走向融合。在o1发布后，王小川在第一时间接受了我们的访谈。关于o1和强化学习，他有一些核心观点： 1、 o1 不代表范式转弯，而 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博