闭卷开考全国一卷，AI大模型高考数学全部不及格？！

电子发烧友网 · 公众号 · · 2024-06-20 20:35

文章预览

电子发烧友网报道（文/周凯扬）当下的大模型除了卷商业化变现外，又开辟出了一个新的“赛博斗蛐蛐”赛道，以各种评测标准来测试大模型在语言、数学、推理和代码方面的综合成绩。作为国内最权威的考试之一，高考则是最能代表学生综合能力的一次考验，而大模型这个特殊身份的考生，如果参加高考究竟会获得怎样的成绩，也激起了网友的好奇之心。上海人工智能实验室的大模型评测体系OpenCompass在近日举办了这么一次测试，让6大开源模型和GPT-4o参加一次特殊的“高考”，然而这些大模型获得的成绩却让不少人大跌眼镜。闭卷开考全国一卷在这次大模型参加高考中，OpenCompass的首轮测试采用了全国新课标I卷的语数外试卷作为题源，该卷的覆盖省份包括江苏、浙江、河北、福建、山东、湖北、湖南、广东等。为了方便测试，除了省去其他非 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博