OpenAI o1大模型开启新范式｜国君热点研究

国泰君安证券研究 · 公众号 · 证券 · 2024-09-20 06:58

文章预览

OpenAI 发布o1大模型（即草莓模型），推理能力大幅提升。国君海外科技、电子、计算机、传媒多个团队观点如下：进一步打开AI应用落地的空间国君海外科技秦和平团队： o1大模型首次证明了语言模型可以进行真正的强化学习，推理能力可沿着Scaling Law而得到提升，走向真正的“智能”。 OpenAI o1是经过强化学习训练来执行复杂推理任务的新型语言模型，o1在回答之前会思考，可以在响应用户前产生一个很长的内部思维链。思维链意味着模型在作出反应之前，花更多时间思考问题，将棘手的步骤分解为更简单的步骤，尝试不同的策略，并认识到自己的错误。这种Scaling束与LLM的预训练显著不同，Scaling重心向后训练 & 推理转移。o1的性能可通过提高强化学习（训练时计算）和思考时间（测试时计算）而持续提高，扩展这种方法的限制与LLM预训练的限制有 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

郁言债市 · 中金基金李耀光：基础设施公募REITs的时代机遇

4 天前

有思想的尘埃 · 写在黄金不断创历史新高之际（续）——胡子总对黄金的新“认知”

4 天前

华泰睿思 · 华泰 | 近期交运板块的三条投资主线

5 天前

国泰君安证券研究 · 国君研究｜全行业周观点0916-0920

6 天前

钢铁俱乐部 · 【国盛钢铁】钢铁：8月数据跟踪：粗钢产量回落，政策利好需求释放

1 周前

上海发展改革 · 【营商环境】做强街镇基层基础，打通营商环境“最后一公里”！市发展改革委召开街镇营商环境座谈会

1 周前

中国广西政府网 · 护山河无恙绘兴边画卷——广西边境行记

1 周前