专栏名称: 劳动报
打造沪上劳动维权最强平台,每天播报网络舆情最新动态。
今天看啥  ›  专栏  ›  劳动报

AI高考首秀“翻车”!数学不及格!AI批作文,10秒圈出4处错,靠谱吗?

劳动报  · 公众号  · 社会  · 2024-06-20 14:56
    

文章预览

劳动报记者 李成溪 摄影 展翔 Al高考首秀“翻车”了? 作文写不好、数学不及格 近日 “Al高考测试最高分303”话题 火上热搜 引发大家对AI 教育能力的 深入思考和讨论 ↓↓↓ Al高考首秀“翻车”了? 高考测试最高分303 高考覆盖各类学科及题型,这一面向人类设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。 在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。 评测采用全国新课标I卷,“语数外”三科全卷测试,包括客观题与主观题。 成绩由具备高考评卷经验的老师匿名人工判分, 阅卷开始前,阅卷教师未被告知答卷均由模型生成。   大模型高考成绩 6月19日, OpenCompass发布了首个大模型高考全卷评测结果。 语数外三科加起来的满分为420分↓↓↓ ■ ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览