OpenAI全新发布o1模型 - 幕后采访及一些原汁原味的解释

AI产品黄叔 · 公众号 · · 2024-09-13 06:41

文章预览

3分钟的幕后人员采访，值得看一遍，我加了中英翻译的字幕印象深刻的点： o1是一个推理模型，所以在回答问题之前会推理的更多。所以什么是推理？有些简单的问题，例如，如果你问意大利的首都是哪里，你知道答案是罗马，你真的不用想太多，但是如果你想知道，复杂的谜题或你想写真正好的商业计划书，你想写小说，你可能需要考虑一下，你想得越多越好。所以推理的结果是转向的能力，思考时间转向更好的结果。我认为真正酷的是，研究是有一个顿悟的时刻，你们什么时候有那种顿悟的时刻？第一位：产生连贯的思维链另一位：当我们意识到如果用 RL 训练模型来生成和完善自己的思维链，它能比人类为其编写思维场景做得更好时，我有了一个“啊哈时刻”。这表明我们可以通过这种方式真正 scale this（扩大规模），实现卓越的推 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

潇湘晨报 · 知名女演员官宣离婚

2 天前

潇湘晨报 · 太突然！官方证实已去世，死因公布

2 天前

潇湘晨报 · 奔驰车前后牌照不一致司机竟辩称为方便停车，长沙交警：拘留10日扣12分罚4000

2 天前

株洲交通984 · 2025年汽车以旧换新补贴政策发布！有哪些变化和利好？

3 天前

3060 · 2024年上半年氢能产业跟踪报告：氢能首次纳入政府工作报告+节能降碳方案实施，2024年氢能景气度提升（附2报告原文下载）

6 月前

简单心理Uni · 人生短短几十年，你值得一份终身热爱的职业 | 心理咨询师培养计划24年冬季班招募

2 月前