Google 发布最新开放大语言模型 Gemma 2，现已登陆 Hugging Face Hub

Hugging Face · 公众号 · 科技自媒体 · 2024-06-28 05:00

主要观点总结

Google发布了最新的开放大语言模型Gemma 2，它与Hugging Face生态系统进行了集成。Gemma 2具有不同的规模和版本，包括基础模型和指令调优版本。本文介绍了Gemma 2的主要技术进展，如滑动窗口注意力、软上限、知识蒸馏、模型合并等。同时，文章还提供了Gemma 2的评估结果，并展示了如何在Hugging Face Transformers中使用它。此外，文章还介绍了Gemma 2与Google Cloud和推理端点的集成，并感谢了为发布和支持该模型做出贡献的社区成员。

关键观点总结

关键观点1: Gemma 2是Google最新的开放大语言模型，与Hugging Face生态系统集成。

Gemma 2具有不同的规模和版本，包括基础模型和指令调优版本。它与Google Cloud和推理端点进行了集成。

关键观点2: Gemma 2的主要技术进展包括滑动窗口注意力、软上限、知识蒸馏和模型合并。

这些技术有助于提高模型的表现和效率。

关键观点3: Gemma 2的评估结果展示了其性能与其他开源LLM的比较。

在开源LLM排行榜上，Gemma 2的表现优秀。

关键观点4: 可以在Hugging Face Transformers中使用Gemma 2。

使用Transformers版本4.42或更高版本，可以轻松地使用Gemma 2进行文本生成和推理。

关键观点5: 发布和支持Gemma 2离不开许多社区成员的贡献。

社区成员为Gemma 2的发布、支持和评估做出了重要贡献。

文章预览

Google 发布了最新的开放大语言模型 Gemma 2，我们非常高兴与 Google 合作，确保其在 Hugging Face 生态系统中的最佳集成。你可以在 Hub 上找到 4 个开源模型 (2 个基础模型和 2 个微调模型) 。发布的功能和集成包括： Hub 上的模型 https://hf.co/collections/google/g-667d6600fd5220e7b967f315 Hugging Face Transformers 集成 https://github.com/huggingface/transformers/releases/tag/v4.42.0 与 Google Cloud 和推理端点的集成 Gemma 2 是什么？ Gemma 2 是 Google 最新的开放大语言模型。它有两种规模：90 亿参数和 270 亿参数，分别具有基础 (预训练) 和指令调优版本。Gemma 基于 Google DeepMind 的 Gemini，拥有 8K Tokens 的上下文长度： gemma-2-9b https://hf.co/google/gemma-2-9b 90 亿基础模型。 gemma-2-9b-it https://hf.co/google/gemma-2-9b-it 90 亿基础模型的指令调优版本。 gemma-2-27b https://hf.co/google/gemma-2-27b 270 亿基础模型。 gemma-2-27b-it http ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博