新版Llama 3 70B反超405B！Meta开卷后训练，谷歌马斯克都来抢镜

量子位 · 公众号 · AI · 2024-12-07 12:19

文章预览

克雷西发自凹非寺量子位 | 公众号 QbitAI OpenAI“双12”刚进行到第二天，就把大模型圈搅得好不热闹！一边是Meta没预告就发布了 Llama 3.3 ，70B版本就能实现以前405B的性能。另一边谷歌的 Gemini 也上线了新的实验版模型，再一次登上大模型竞技场榜首。有网友感叹，o1、Llama 3.3和新版Gemini接连发布，马斯克的Grok3也要来，还有GPT-4.5初露端倪……这简直是最棒的一个圣诞季。 Llama 3.3：70B实现405B效果 Llama 3.3目前只有70B一个型号。但在指令遵循（IFEval）、数学（MATH）、推理（GPQA Diamond）等领域，水平都超过了七月份发布的Llama 3.1 405B 。在语言（MMLU）、代码（HumanEval）、长文本和多语种能力上，成绩也和Llama 3.1 405B比较接近。而在工具使用（BFCL）上，和405B的差距则显得稍大一些。不过，Llama 3.3的使用成本要比Llama 3.1 405B低得多。虽然Llama ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博