文章预览
ShowMeAI 专业◎洞察◎清晰◎实用 用知识加速每一次技术进步! 推荐语 朋友们!伙伴们 👀 如果觉得咱们日报还行 ,请留下 点 赞 好 嘛 ! 也 欢迎 分 享 给你的朋友 ! 这对 ShowMeAI 真的很重要!(拜托拜托 🙏 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o), 组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试 ,然后由经验丰富的判卷老师评判得分。 结果如上图所示, Qwen2-72B、GPT-4o 及 书生·浦语2.0文曲星 (InternLM2-20B-WQX) 成为本次大模型高考的前三甲 ,得分率均超过70%。 但是! 参与测试的所有大模型,「数学」考试都没过及格线 (90分) 。 根据官方披露的原因,大模型在数学考试中失分的主要原因是: 主观题回答相对凌乱,且过程具有迷惑性 ,甚
………………………………