刚刚，谷歌用更少参数打败 Qwen 2.5-32B！新模型 Gemma 3 号称“单 GPU 模型王”，团队紧急招兵买马！

AI前线 · 公众号 · AI · 2025-03-12 19:18

主要观点总结

谷歌发布了新的AI模型Gemma 3，这是一个轻量级的模型，开发者可以在手机、笔记本电脑和工作站上直接快速运行。该模型支持超过35种语言，具备分析文本、图像及短视频的能力，并在LLM排行榜上表现优异。文章介绍了Gemma 3的新功能、技术优化、社区反响及小模型和蒸馏工艺的兴起。

关键观点总结

关键观点1: Gemma 3的特点和性能

Gemma 3是谷歌新发布的轻量级AI模型，支持超过35种语言，具备分析文本、图像和短视频的能力。它在LLM排行榜上的表现优异，被认为是一种高效的模型。

关键观点2: Gemma 3的技术优化

Gemma 3在架构上进行了两方面的改进：下文长度扩展和预训练优化。它通过增加局部注意力层，减少长上下文时KV缓存爆炸问题。此外，它在预训练方面进行了优化，使用高效的蒸馏过程确保学生模型准确学习教师模型的输出分布。

关键观点3: 社区反响

Gemma 3的发布引发了热烈讨论。许多网友对它在LLM Arena上的表现表示惊讶，并认为这是一个突破性的进展。一些开发者对谷歌的技术创新表示感谢，并强调了开放这些模型的重要性。

关键观点4: 小模型和蒸馏工艺的兴起

随着小型语言模型的兴趣增加，企业开始意识到并非所有应用场景都需要大语言模型的全部功能。蒸馏工艺作为一种将大型模型的知识转移到小型模型的技术，正逐渐成为企业优化AI部署的重要手段。

文章预览

作者｜冬梅、褚杏娟尽管大型语言和推理模型仍然很受欢迎，但企业越来越多地转向使用较小的模型来运行人工智能流程，从而减少能源和成本方面的担忧。 3 月 12 日，谷歌宣布推出了 Gemma 3 开源 AI 模型，这是基于与 Gemini 2.0 模型相同的研究和技术构建。谷歌在其官方博客中表示，Gemma 3 是一组轻量级的模型，开发者可以在手机、笔记本电脑以及工作站这些设备上直接快速地运行。该模型支持超过 35 种语言，并具备分析文本、图像及短视频的能力。谷歌又发新模型 Gemma 3 Gemma 3 有不同的规模可供选择，分别是 10 亿参数（1B）、40 亿参数（4B）、120 亿参数（12B）和 270 亿参数（27B）。开发者可以根据自身设备的硬件条件以及对性能的要求，选择适当的模型。项目地址： https://ollama.com/library/gemma3 谷歌表示，Gemma 3“以其尺寸提供了最先进的性 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博