国产大模型速度评测（谁是更快大模型？）

Coggle数据科学 · 公众号 · · 2024-07-15 10:13

文章预览

2024年无疑会被载入史册，各大科技厂商纷纷争先恐后地推出了自家的大模型产品。6月25日OpenAI暂停在我国大陆地区服务，国产大模型表现更加值得期待。本文将对比较流行的国产大模型进行速度评测，通过不同类型的问题来对比模型的回答速度。统计的标准为 completion tokens 数除以耗时。 unset unset 模型速度对比 unset unset 场景1：通用问答类型问题你是一名专业的人工智能专家，请告诉我如何学习深度学习？模型名称 token/s ERNIE-3.5-8K 18 Moonshot-v1-8k 32 GLM4-Air 47 GLM4-AirX 89 Qwen-turbo 40 deepseek-chat 19 Spark Max 16 场景2：逻辑推理类型问题如果A+B=12, A-B=10，则A的值是？模型名称 token/s ERNIE-3.5-8K 10 Moonshot-v1-8k 23 GLM4-Air 43 GLM4-AirX 71 Qwen-turbo 29 deepseek-chat 13 Spark Max 17 场景3：NLP实体识别问题识别下面句子中所有的地名：我将会在明天早上的8 点来到的湖北黄陂的森林 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博