专栏名称: ShowMeAI研究中心
为AI硬核资料库(cool)而生!
今天看啥  ›  专栏  ›  ShowMeAI研究中心

一份LLM资源清单,围观技术大佬的日常;大型AI数据中心搭建攻略(美国版);为啥大模型做不好数学计算?| ShowMeAI日报

ShowMeAI研究中心  · 公众号  ·  · 2024-06-21 23:59

文章预览

ShowMeAI 专业◎洞察◎清晰◎实用 用知识加速每一次技术进步! 推荐语 朋友们!伙伴们 👀 如果觉得咱们日报还行 ,请留下 点 赞 好 嘛 ! 也 欢迎 分 享 给你的朋友 ! 这对 ShowMeAI 真的很重要!(拜托拜托 🙏 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o), 组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试 ,然后由经验丰富的判卷老师评判得分。 结果如上图所示, Qwen2-72B、GPT-4o 及 书生·浦语2.0文曲星 (InternLM2-20B-WQX) 成为本次大模型高考的前三甲 ,得分率均超过70%。 但是! 参与测试的所有大模型,「数学」考试都没过及格线 (90分) 。 根据官方披露的原因,大模型在数学考试中失分的主要原因是: 主观题回答相对凌乱,且过程具有迷惑性 ,甚 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览