专栏名称: 商汤科技SenseTime

商汤科技是国家科技部授予的“智能视觉”人工智能开放创新平台，以“坚持原创，让AI引领人类进步”为使命和愿景，建立并打造全球领先的深度学习平台和超算中心，并研发一系列AI技术。关注商汤科技SenseTime，与我们一同拥抱AI大时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

近3000道题，商汤大模型拿了金牌

商汤科技SenseTime · 公众号 · · 2024-11-08 15:03

文章预览

模型表现好，金牌少不了。刚刚，中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》：商汤日日新·商量大模型（SenseChat5.5）凭借出色的能力表现，总得分位列国内大模型第一梯队，获得金牌。本次SuperCLUE10月报告覆盖23个国内模型，聚焦语言大模型的通用能力评估，分为三大维度：除了考察 “文科”、“理科” 基础能力外，还有考察模型更高阶能力的 “Hard” 附加任务，总共2900+道题：【理科任务】分为计算、逻辑推理、代码、工具使用测评集；【文科任务】分为知识百科、语言理解、长文本、角色扮演、生成与创作、安全六大测评集；【Hard任务】分为精确指令遵循测评集，复杂任务高阶推理测评集。商汤SenseChat5.5在多项评测任务中均位列第一梯队，文科中语言理解、安全等维度表现突出，也是理科中逻辑推理、代 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博