专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

无法作弊的大模型评测来了!2024高考新I卷数学 客观题部分评测结果出炉!

AINLP  · 公众号  ·  · 2024-06-08 22:24
    

文章预览

转自:FudanNLP 又到一年一度的高考季,这是青春的试金石,也是智慧的盛宴。一批青年学子将在高考的舞台上诠释自己的青春,实现自己的梦想,在此我们预祝广大考生都能金榜题名! 与此同时,全新出炉的高考试题具备高度的 独创性 和 保密性 ,是用来评测大模型的 绝好评测集合 。为此,我们连夜挑选了六个在各项评测中脱颖而出的大模型,让他们与广大考生一起,来进行一场 真刀真枪,不能作弊 的实战。 我们选取了网络上流出的2024高考新I卷数学题目,选择了前14个客观题作为我们的评测集合,并根据高考的评分规则,对模型的结果进行了打分。 评分标注: 单选题共 8 题,每小题 5 分,共 40 分。 多选题共 3 题,每小题 6 分,共 18 分。全部正确选项选对得6分,部分选对的得部分分,有选错的得0分。 填空题共 3 题,每小题 5 分,共 15 分 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览
推荐文章