文章预览
克雷西 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 笑死,原来o1也像人类一样喜欢赶ddl 。 这是在o1团队的“大型见面会”上,OpenAI创始成员Wojciech Zaremba揭开的o1“黑历史”。 包括Zaremba在内的18名团队成员,在首席研究官Bob McGrew的带领之下围坐一团。 o1核心贡献者Hyung Won Chung、Noam Brown等关键人物,也都在此列。 随着成员们的踊跃发言,o1的发展历程也逐渐被揭开——受AlphaGo和早期GPT模型的启发,想到了将两张背后的范式结合。 后来,团队训练出了第一个可以生成连贯思维链的模型,标志着研究方向开始逐渐明朗和聚焦…… 在充满松弛感的气氛当中,众人还分享了有关o1研发的许多趣事: 在OpenAI内部,也喜欢用“数r”来测试大模型能力 为了解决“数r”的问题,OpenAI花费了一年半 技术人员会把代码报错信息直接丢给o1去debug o1曾经说过,生命的意义
………………………………