今天看啥  ›  专栏  ›  LLM SPACE

迟到的愚人节恶作剧?Llama 4实战频频翻车,“学霸人设”崩塌(附真实测评)

LLM SPACE  · 公众号  ·  · 2025-04-08 18:47
    

文章预览

Meta终于放大招,上线了Llama 4 模型系列!官方宣传中,它俨然化身“六边形战士”。但其真实能力是否经受得住推敲呢?我们对此展开了系列测评,详情请见正文。   产品设计与定位 •  Llama4 Scout :17B 激活参数,16 个 Expert,109B 的总参数。特点是支持 10M 的上下文(Llama3只有128k 上下文)。 •  Llama4 Maverick :17B 激活参数,128 个 Expert,400B 的总参数。特点是支持原生多模态的 1M 上下文的模型。预期应该持平或超过 Llama3-405B 的性能。 •  Llam a4 Behe moth :288B 激活参数,2T 总参数。这个和 GPT-5 的“大杀器”的逻辑类似,特点是训练超大规模的模型,尝试深入探索参数尺度上的 Scaling Law。 技术亮点 • 稀疏混合专家(Sparse Mixture of Experts) • 原生多模态,通过早期融合技术,模型将文本和视觉 token 整合到一个统一框架中。 • 训练量(30万亿Token,比 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览