专栏名称: 科学网
作为全球最大的中文科学社区,科学网(www.sciencenet.cn)致力于全方位服务华人科学与高等教育界,以网络社区为基础构建起面向全球华人科学家的网络新媒体,促进科技创新和学术交流。
今天看啥  ›  专栏  ›  科学网

谁是最会做题大模型?“高考评测”来了

科学网  · 公众号  · 科学  · 2024-06-24 17:31
    

文章预览

文 | 《中国科学报》记者 赵广立 2024年全国高考的“硝烟”刚刚散去不久,“大模型考生”就被抓回来重新“做题”了。 市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国内最权威的考试之一,高考覆盖各类学科及题型,同时在开考前属于“绝密”,非常适合用来作为考查大模型智能水平的评测工具,堪称大模型综合能力的“试金石”。 连日来,一些专业机构纷纷下场,使用市面上常见的大模型产品如通义千问、字节豆包、讯飞星火、文心一言、腾讯元宝、Kimi等作为“考生”,围绕“大模型高考测试”得出了一系列结果,为人们更好地了解大模型产品的性能和特点提供了参考样本。 AI高考数学全不及格?换个打开方式试试 近期,一则“AI高考测试出分,数学全不及格 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览