专栏名称: 科学网

作为全球最大的中文科学社区，科学网（www.sciencenet.cn）致力于全方位服务华人科学与高等教育界，以网络社区为基础构建起面向全球华人科学家的网络新媒体，促进科技创新和学术交流。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

谁是最会做题大模型？“高考评测”来了

科学网 · 公众号 · 科学 · 2024-06-24 17:31

文章预览

文 | 《中国科学报》记者赵广立 2024年全国高考的“硝烟”刚刚散去不久，“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱，围绕“大模型技术哪家强”的讨论不绝于耳，各色名目的大模型评测应运而生。作为国内最权威的考试之一，高考覆盖各类学科及题型，同时在开考前属于“绝密”，非常适合用来作为考查大模型智能水平的评测工具，堪称大模型综合能力的“试金石”。连日来，一些专业机构纷纷下场，使用市面上常见的大模型产品如通义千问、字节豆包、讯飞星火、文心一言、腾讯元宝、Kimi等作为“考生”，围绕“大模型高考测试”得出了一系列结果，为人们更好地了解大模型产品的性能和特点提供了参考样本。 AI高考数学全不及格？换个打开方式试试近期，一则“AI高考测试出分，数学全不及格 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

科普中国 · 快停下！这个习惯让人反复内耗！但很多人却每天都在无意识地做

5 小时前

科普中国 · 谈恋爱时有这 3 种表现，说明你对关系的底线太低了

昨天

环球科学 · 数学家告诉你，真正的π日不是今天，是7月22日

3 天前

科普中国 · 鼻窦炎为何反复发作？中国科学家破解“魔咒”背后谜团

3 天前

跨境知道 · 独立站品牌运营模式最全解析！全篇干货！

8 月前

麻省理工科技评论 · #十大突破性技术# 【《麻省理工科技评论》2025年“十大突破性-20250107110706

2 月前