文章预览
2024年无疑会被载入史册,各大科技厂商纷纷争先恐后地推出了自家的大模型产品。6月25日OpenAI暂停在我国大陆地区服务,国产大模型表现更加值得期待。 本文将对比较流行的国产大模型进行速度评测,通过不同类型的问题来对比模型的回答速度。统计的标准为 completion tokens 数除以耗时。 unset unset 模型速度对比 unset unset 场景1:通用问答类型问题 你是一名专业的人工智能专家,请告诉我如何学习深度学习? 模型名称 token/s ERNIE-3.5-8K 18 Moonshot-v1-8k 32 GLM4-Air 47 GLM4-AirX 89 Qwen-turbo 40 deepseek-chat 19 Spark Max 16 场景2:逻辑推理类型问题 如果A+B=12, A-B=10,则A的值是? 模型名称 token/s ERNIE-3.5-8K 10 Moonshot-v1-8k 23 GLM4-Air 43 GLM4-AirX 71 Qwen-turbo 29 deepseek-chat 13 Spark Max 17 场景3:NLP实体识别问题 识别下面句子中所有的地名:我将会在明天早上的8 点来到的湖北黄陂的森林
………………………………