一份LLM资源清单，围观技术大佬的日常；大型AI数据中心搭建攻略(美国版)；为啥大模型做不好数学计算？| ShowMeAI日报

ShowMeAI研究中心 · 公众号 · · 2024-06-21 23:59

文章预览

ShowMeAI 专业◎洞察◎清晰◎实用用知识加速每一次技术进步! 推荐语朋友们！伙伴们 👀 如果觉得咱们日报还行，请留下点赞好嘛！也欢迎分享给你的朋友！这对 ShowMeAI 真的很重要！（拜托拜托 🙏 1. 为啥大模型做不好简单的数学计算？从大模型高考数学成绩不及格说起司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o)，组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试，然后由经验丰富的判卷老师评判得分。结果如上图所示， Qwen2-72B、GPT-4o 及书生·浦语2.0文曲星 (InternLM2-20B-WQX) 成为本次大模型高考的前三甲，得分率均超过70%。但是！参与测试的所有大模型，「数学」考试都没过及格线 (90分) 。根据官方披露的原因，大模型在数学考试中失分的主要原因是：主观题回答相对凌乱，且过程具有迷惑性，甚 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博