刚刚，谷歌开源单 GPU 最强模型 Gemma 3：小模型性能超越 Llama-3、DeepSeek-V3

InfoQ · 公众号 · 科技媒体 · 2025-03-12 20:05

主要观点总结

谷歌发布了新的AI模型Gemma 3，这是一个轻量级的模型，可以在手机、笔记本电脑和工作站上快速运行。Gemma 3支持多种语言，具备文本、图像和短视频分析能力。该模型有不同规模可供选择，根据硬件性能要求，开发者可以选择适当的模型规模。Gemma 3在架构上进行了优化，包括上下文长度扩展和预训练优化。网友对Gemma 3和Qwen 2.5进行了基准测试比较，两者在分数上相近。同时，谷歌表示Gemma 3是世界上最优秀的单加速器模型之一。

关键观点总结

关键观点1: Gemma 3的特点和性能

Gemma 3是谷歌新发布的轻量级AI模型，支持多种语言，具备文本、图像和短视频分析能力。它在LLM Arena排行榜上表现出色，超过了其他领先模型。Gemma 3还提供不同的规模供开发者选择，可以根据硬件条件选择适当的模型。

关键观点2: Gemma 3的架构优化

Gemma 3在架构上进行了两方面的改进：上下文长度扩展和预训练优化。通过增加局部注意力层的比例和缩短局部注意力的跨度，缓解了长上下文时的KV缓存爆炸问题。此外，Gemma 3还重新设计了数据混合策略，提升了模型的多语言能力，并融入了图像理解能力。

关键观点3: 网友对Gemma 3的评价和对比

有网友对Gemma 3和Qwen 2.5进行了基准测试比较，认为两者在分数上相近。一些网友表示对Gemma 3的表现感到惊讶，并认为这是一个可接受的较小模型。同时，开发者对谷歌的技术创新表示感谢，并强调了开放模型的重要性。

关键观点4: 小型模型和蒸馏工艺的趋势

企业对小型模型的兴趣正在增加，这些模型在特定任务中表现出色，尤其是在资源有限的环境中。蒸馏工艺作为一种将大型模型的知识转移到小型模型的技术，正逐渐成为企业优化AI部署的重要手段。Gemma 3的出现表明小型模型也能具备强大的性能。

文章预览

作者｜冬梅、褚杏娟尽管大型语言和推理模型仍然很受欢迎，但企业越来越多地转向使用较小的模型来运行人工智能流程，从而减少能源和成本方面的担忧。 3 月 12 日，谷歌宣布推出了 Gemma 3 开源 AI 模型，这是基于与 Gemini 2.0 模型相同的研究和技术构建。谷歌在其官方博客中表示，Gemma 3 是一组轻量级的模型，开发者可以在手机、笔记本电脑以及工作站这些设备上直接快速地运行。该模型支持超过 35 种语言，并具备分析文本、图像及短视频的能力。谷歌又发新模型 Gemma 3 Gemma 3 有不同的规模可供选择，分别是 10 亿参数（1B）、40 亿参数（4B）、120 亿参数（12B）和 270 亿参数（27B）。开发者可以根据自身设备的硬件条件以及对性能的要求，选择适当的模型。项目地址： https://ollama.com/library/gemma3 谷歌表示，Gemma 3“以其尺寸提供了最先进的性能 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博