今天看啥  ›  专栏  ›  旺知识

通义千问(Qwen)2大模型技术报告全文翻译解读

旺知识  · 公众号  ·  · 2024-07-20 17:02

文章预览

本报告介绍了 Qwen2 系列,这是大型语言模型和大型多模态模型的最新成员。文本发布了一套全面的基础和指令调优语言模型,参数范围从 0.5 到 72 亿,包括密集模型和专家混合模型。Qwen2 超越了大多数以前的开放权重模型,包括其前身 Qwen1.5,并在语言理解、生成、多语言能力、编码、数学和推理等多个基准测试中展现出与专有模型相媲美的性能。 我们翻译解读最新论文:Qwen2技术报告,文末有论文链接。 作者:张长旺,图源:旺知识 旗舰模型 Qwen2-72B 展示了卓越的性能:在 MMLU 上得分 84.2,在 GPQA 上得分 37.9,在 HumanEval 上得分 64.6,在 GSM8K 上得分 89.5,在 BBH 上得分 82.4 作为基础语言模型。指令调优变体 Qwen2-72B-Instruct 在 MT-Bench 上得分 9.1,在 Arena-Hard 上得分 48.1,在 LiveCodeBench 上得分 35.7。此外,Qwen2 展示了强大的多语言能力,精通约 30 种语言 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览