专栏名称: NLP工作站
AIGC前沿知识分享&落地经验总结
目录
今天看啥  ›  专栏  ›  NLP工作站

开源真卷!Google开源Gemma 2大模型

NLP工作站  · 公众号  ·  · 2024-06-28 07:44

文章预览

Google 发布了最新的开放大语言模型 Gemma 2,共涉及4 个开源模型 (2 个基础模型和 2 个微调模型) 。HF模型地址: https://hf.co/collections/google/g-667d6600fd5220e7b967f315 Gemma 2 是什么? Gemma 2 是 Google 最新的开放大语言模型。它有两种规模:90 亿参数和 270 亿参数,分别具有基础 (预训练) 和指令调优版本。Gemma 基于 Google DeepMind 的 Gemini,拥有 8K Tokens 的上下文长度: gemma-2-9b https://hf.co/google/gemma-2-9b 90 亿基础模型。 gemma-2-9b-it https://hf.co/google/gemma-2-9b-it 90 亿基础模型的指令调优版本。 gemma-2-27b https://hf.co/google/gemma-2-27b 270 亿基础模型。 gemma-2-27b-it https://hf.co/google/gemma-2-27b-it 270 亿基础模型的指令调优版本。 Gemma 2 模型的训练数据量约为其第一代的两倍, 总计 13 万亿 Tokens (270 亿模型) 和 8 万亿 Tokens (90 亿模型) 的网页数据 (主要是英语) 、代码和数学数据。 我们不知 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览