专栏名称: 商汤科技SenseTime
商汤科技是国家科技部授予的“智能视觉”人工智能开放创新平台,以“坚持原创,让AI引领人类进步”为使命和愿景,建立并打造全球领先的深度学习平台和超算中心,并研发一系列AI技术。关注商汤科技SenseTime,与我们一同拥抱AI大时代。
今天看啥  ›  专栏  ›  商汤科技SenseTime

大语言模型“书生·浦语”多项专业评测拔头筹

商汤科技SenseTime  · 公众号  ·  · 2023-08-25 12:52
最近,AI大模型测评火热,尤其在大语言模型领域,“聪明”的上限被不断刷新。商汤与上海AI实验室等联合打造的大语言模型“书生·浦语”(InternLM)也表现出色,分别在智源FlagEval大语言模型评测8月排行榜和中文通用大模型综合性评测基准SuperCLUE 7月评测榜两项业内权威大模型评测榜单中获得优异成绩。“FlagEval是知名人工智能新型研发机构北京智源人工智能研究院推出的大模型评测体系及开放平台。FlagEval大模型评测体系构建了“能力-任务-指标”三维评测框架,可视化呈现评测结果,总计600+评测维度,包括22个主观、客观评测数据集,84433道评测题目。除知名的公开数据集 HellaSwag、MMLU、C-Eval外,FlagEval还集成了包括智源自建的主观评测数据集Chinese Linguistics & Cognition Challenge (CLCC),北京大学等单位共建的词汇级别语义关系判断、句子级别语义关 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照