专栏名称: 电子发烧友网
关注电子发烧友网,即时收听电子行业动态,抢先知晓半导体行业发生的最新事件。
今天看啥  ›  专栏  ›  电子发烧友网

闭卷开考全国一卷,AI大模型高考数学全部不及格?!

电子发烧友网  · 公众号  ·  · 2024-06-20 20:35
    

文章预览

电子发烧友网报道(文/周凯扬)当下的大模型除了卷商业化变现外,又开辟出了一个新的“赛博斗蛐蛐”赛道,以各种评测标准来测试大模型在语言、数学、推理和代码方面的综合成绩。作为国内最权威的考试之一,高考则是最能代表学生综合能力的一次考验,而大模型这个特殊身份的考生,如果参加高考究竟会获得怎样的成绩,也激起了网友的好奇之心。 上海人工智能实验室的大模型评测体系OpenCompass在近日举办了这么一次测试,让6大开源模型和GPT-4o参加一次特殊的“高考”,然而这些大模型获得的成绩却让不少人大跌眼镜。 闭卷开考全国一卷 在这次大模型参加高考中,OpenCompass的首轮测试采用了全国新课标I卷的语数外试卷作为题源,该卷的覆盖省份包括江苏、浙江、河北、福建、山东、湖北、湖南、广东等。为了方便测试,除了省去其他非 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览