文章预览
图片来源:由无界AI生成 作者|参商 编辑|星奈 2024 年就要结束了,在这一年里,大模型的智力水平究竟长进了多少? 上周日,2025考研初试刚刚结束,我们趁热拿考研数学卷子,去测测主流的几家国产大模型,看看他们的真实智商水平如何。 5位国产大模型考生名单: 大厂巨头代表队:字节豆包、阿里通义 创业公司代表队:智谱、Kimi 私募巨头代表队:DeepSeek 记得6月份高考的时候,很多媒体做了大模型高考成绩评测,结果发现大家的语文成绩都能考100分以上,但数学成绩基本都惨不忍睹,低的只有37分,高的也不过60多分,没有一家能及格。要知道高考数学的满分是150,只有考到90分以上才算及格。 这也侧面说明,起码在自然语言理解这一块,大模型基本已经“及格”,但在人类与其他物种拉开差距的“逻辑思维”能力上,哪怕还需要继续进化
………………………………