专栏名称: 极客公园
科技创新者的大本营。汇聚优秀的产品报道、评测视频和高质量的线下活动。
今天看啥  ›  专栏  ›  极客公园

当大模型开始「考上」一本

极客公园  · 公众号  · 科技媒体  · 2024-06-24 22:47
参加 2024 河南高考,豆包和文心 4.0 过了一本线,但比 GPT-4o 还差点。作者 | 甘德编辑 | 郑玄今天的大模型,智力水平到底如何?2024 年高考陆续出分,我们想要解开这个过去一年普罗大众一直争论不休的话题。高考是衡量人类智力和学识水平的标尺之一,以今天大模型的水准,参加高考到底是能轻松考上清华北大,还是连上大专都够呛。我们邀请了九个大模型参加这场考试——包括公认大模型能力天花板的 GPT-4o,以及四个国内大厂(百度、阿里、腾讯、字节)和四个新锐独角兽(百川、智谱、月之暗面和 MiniMax)的公开模型产品。他们考试的题目是覆盖地域众多、难度最高的新课标 Ⅰ 卷,这也是高考大省河南使用的考卷。我们也将以河南的分数线评判,这九个大模型考生在中国最卷的高考大省,到底能上几本。有意思的是,这份考卷的作文题目 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照