“草莓”现真身

调研纪要 · 公众号 · · 2024-09-13 14:04

文章预览

9月13日，OpenAl宣布其最新的模型OpenAl o1 （内部代号“草莓大模型”）正式发布，主打推理能力，号称能解决比以往模型更难的科学、编程和数学问题。 - 推理能力大： OpenAI 表示，o1 模型在物理、化学和生物等学科的 challenging 基准测试中，表现与博士生相当 - 数学和编程能力：在一项国际数学奥林匹克竞赛（IMO）的资格考试中，GPT-4o 的正确率只有 13%，而 o1 模型的正确率高达 83%！在 Codeforces 编程竞赛中，o1 模型的成绩也达到了前 89%！之前的市场预期：发布时间基本符合预期：技术关键点：RL & CoT & 慢思考换取推理能力【大幅】提升【为什么提高？Scaling Law新范式，从预训练向后训练和推理转移】 o1经过强化学习训练来执行复杂的推理，并在回答之前产生一个很长的内部思维链（CoT）。强化学习（RL）+ 思维链（CoT）在高度数据高效的训 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宛央女子 · 宜修不是死在甄嬛手里，而是自杀

昨天

宛央女子 · 庆奶的那张脸谁不想要啊

昨天

彬彬有理 · 麦琳会反转吗？

3 天前

爸妈领域 · 中国一个奇怪的现象：大部分的妈妈，都是既要赚钱，又要顾家，化妆打扮的时间越来越少，心却越来越累

3 天前

顶尖广告 · 抵制女性污名化，被茉莉奶白“撸铁奶茶”破防了！

4 天前

顶尖广告 · 抵制女性污名化，被茉莉奶白“撸铁奶茶”破防了！

4 天前