文章预览
王鹏 腾讯研究院资深专家 经过漫长的等待,OpenAI终于在9月12日发布了新模型O1,用户可以直接访问预览版o1-preview,或者小尺寸版o1-mini。其酝酿了快一年的大招,一会儿Q*、一会儿草莓、一会儿AGI、一会儿GPT5,耗得核心技术团队都快走光了,才终于拿出来让所有人检验和评论。这样一个备受瞩目的产品,势必对行业甚至社会产生深远的影响。而且它不像平时那些版本更新一样,只是简单的技术能力提升,而需要从多个视角和维度去观察和预测其影响。 一、大进步 与GPT-4o相比,o1-preview在解决数学和编程问题上的能力提升了5倍以上,而还未放出的o1则超过8倍!在解决博士级别科学题目的时的成功率,都已经超过了人类专家的水平。理化竞赛能力都超过了人类博士的水平;在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13% 的问题,而推
………………………………