今天看啥  ›  专栏  ›  共识粉碎机

OpenAI o1模型十问十答

共识粉碎机  · 公众号  ·  · 2024-09-14 20:41

文章预览

关注共识粉碎机,获取历史讨论会纪要 Q1:o1的开发者反馈怎么样? A1: 就和大家看得各种测评集一样,多数场景好一点。Coding(Devin报告)、教育做题场景(各类做题)、以及统计分析场景提高很多。 另外o1模型对于开发者来说,比用4o这些模型更难。因为o1内嵌cot,对很多开发者来说要重新改product flow,原来自己做的cot都不行。对于API的Finetune要求也会更高。 我们看到o1的早期客户一开始用的感受是小幅提升,但经过合作Finetune后,模型效果提升明显。 所以可能过一段时间会看到越来越多的usecase。 Q2:o1的Researcher反馈? A2: 很兴奋,解锁了很多研究员的心结。第一个是发现了一条稳步提升性能的新路径。第二个是发现API可以不管First Token Latency,而且居然还有场景。所有Researcher都会往这个方向再做一遍。 但RL的难度比Pretrain更高,寻找信号过程 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览