OpenAI o1模型十问十答

共识粉碎机 · 公众号 · · 2024-09-14 20:41

文章预览

关注共识粉碎机，获取历史讨论会纪要 Q1：o1的开发者反馈怎么样？ A1：就和大家看得各种测评集一样，多数场景好一点。Coding（Devin报告）、教育做题场景（各类做题）、以及统计分析场景提高很多。另外o1模型对于开发者来说，比用4o这些模型更难。因为o1内嵌cot，对很多开发者来说要重新改product flow，原来自己做的cot都不行。对于API的Finetune要求也会更高。我们看到o1的早期客户一开始用的感受是小幅提升，但经过合作Finetune后，模型效果提升明显。所以可能过一段时间会看到越来越多的usecase。 Q2：o1的Researcher反馈？ A2：很兴奋，解锁了很多研究员的心结。第一个是发现了一条稳步提升性能的新路径。第二个是发现API可以不管First Token Latency，而且居然还有场景。所有Researcher都会往这个方向再做一遍。但RL的难度比Pretrain更高，寻找信号过程 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新华社 · 小小珍珠，富了一座小镇！

昨天

新华社 · 北京市取消普通住房和非普通住房标准

3 天前

澎湃新闻 · 突发！吉林一滑冰馆屋顶坍塌

3 天前

江南晚报 · 突发！吉林白城一滑冰馆被曝发生坍塌

3 天前

人民网 · 新纪录产生！150000000000+

3 天前

金融八卦女频道 · 疯狂的骗保：有医院拉1个人头住院给300元，免费就餐、包接送

1 月前

将门创投 · Talk预告｜UT-Austin樊志文：端到端从多视角图片解析3D与全景3D生成

1 周前