五大维度评测OpenAI全新o1模型：代码编写、游戏制作等能力“惊艳”，事实性知识却“翻了车”

每日经济新闻 · 公众号 · 生活 · 2024-09-14 00:29

文章预览

传说中的“草莓”模型今天在没有任何预告下忽然上线了！ OpenAI最新发布的模型名为o1，是系列推理模型的首批版本，现阶段推出的是o1-preview（预览版）和o1-mini（迷你版）。目前，o1-preview和o1-mini已经面向ChatGPT Plus和Team订阅用户开放，而Enterprise和Edu用户将于下周初获得访问权限。OpenAI表示，它计划向ChatGPT的所有免费用户提供o1-mini访问权限，但尚未确定发布日期。据OpenAI介绍，在解决问题的能力方面，o1模型比以往任何模型都更接近人类思维，并且能够“推理”数学、编码和科学任务。为了验证新模型的能力是否正如OpenAI所宣称的那么强大，《每日经济新闻》记者从经典“草莓测试”、代码编写、小游戏制作、数学与经济学，以及事实性知识这五大维度对o1-preview模型进行了测试。结果显示，o1-preview表现出了超越OpenAI之前发布的大模型的编程和 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博