专栏名称: arXiv每日学术速递
跟踪计算机视觉、人工智能、机器学习、NLP、语音识别、量化金融等热门方向学术信息
今天看啥  ›  专栏  ›  arXiv每日学术速递

豆包文科成绩超了一本线,为什么理科不行?

arXiv每日学术速递  · 公众号  ·  · 2024-07-02 13:57
    

文章预览

金磊 发自 凹非寺 转载 | 量子位 | 公众号 QbitAI 什么?好多大模型的文科成绩 超一本线 ,还是最卷的 河南省 ??? △ 图源:极客公园 没错,最近就有这么一项大模型 “高考大摸底” 评测走红了。 河南高考文科今年的一本线是521分,根据这项评测,共计四个大模型大于或等于这个分数,其中头两名最值得关注: GPT-4o :562分 字节豆包 :542.5分 …… 从结果中来看,GPT-4o的表现依旧是处于领先状态,而在 国产大模型 这边,比较亮眼的成绩便属于 豆包 了。 并且在 语文 和 历史 等科目的成绩甚至还超越了GPT-4o。 这也让不少网友纷纷感慨: AI文科成绩这么好,看来在处理语言和逻辑上还是很有优势的。 不过有一说一,毕竟国产大模型的竞争是如此之激烈,这份评测的排名真的靠谱吗?发布仅数月的豆包,真具备此等实力吗?以及这数学……又是怎 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览