迟到的愚人节恶作剧？Llama 4实战频频翻车，“学霸人设”崩塌（附真实测评）

LLM SPACE · 公众号 · · 2025-04-08 18:47

文章预览

Meta终于放大招，上线了Llama 4 模型系列！官方宣传中，它俨然化身“六边形战士”。但其真实能力是否经受得住推敲呢？我们对此展开了系列测评，详情请见正文。产品设计与定位 • Llama4 Scout ：17B 激活参数，16 个 Expert，109B 的总参数。特点是支持 10M 的上下文（Llama3只有128k 上下文）。 • Llama4 Maverick ：17B 激活参数，128 个 Expert，400B 的总参数。特点是支持原生多模态的 1M 上下文的模型。预期应该持平或超过 Llama3-405B 的性能。 • Llam a4 Behe moth ：288B 激活参数，2T 总参数。这个和 GPT-5 的“大杀器”的逻辑类似，特点是训练超大规模的模型，尝试深入探索参数尺度上的 Scaling Law。技术亮点 • 稀疏混合专家（Sparse Mixture of Experts） • 原生多模态，通过早期融合技术，模型将文本和视觉 token 整合到一个统一框架中。 • 训练量（30万亿Token，比 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博