中国最大开源MoE模型，255B参数无条件免费商用，元象发布

量子位 · 公众号 · AI · 2024-09-14 12:40

文章预览

允中发自凹非寺量子位 | 公众号 QbitAI 元象XVERSE发布中国最大MoE开源模型： XVERSE-MoE-A36B ，该模型总参数255B，激活参数36B，达到100B模型性能的「跨级」跃升。同时训练时间减少30%，推理性能提升100%，使每token成本大幅下降。在多个权威评测中，元象MoE效果大幅超越多个同类模型。包括国内千亿MoE模型 Skywork-MoE、传统MoE霸主Mixtral-8x22B 以及3140亿参数的MoE开源模型Grok-1-A86B等。 MoE（Mixture of Experts）是业界最前沿的混合专家模型架构，将多个细分领域的专家模型组合成一个超级模型，打破了传统扩展定律（Scaling Law）的局限，可在扩大模型规模时，不显著增加训练和推理的计算成本，保持模型性能最大化。出于这个原因，行业前沿模型包括谷歌Gemini-1.5、OpenAI的GPT-4 、马斯克旗下xAI公司的Grok等大模型都使用了 MoE。值得一提的是，元象「高性能全家 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · //@紅塵浪裡好修行:好，变刚需了……-20241121101133

2 天前

宝玉xp · //@梧桐清声:第一步可以直接问，我要改英文作业，一般情况下应该-20241120100317

3 天前

Founder Park · 对话王诗沐：走出大厂创业，做 3D AI 游戏，瞄准新的内容平台机会

5 天前

Founder Park · 对话王诗沐：走出大厂创业，做 3D AI 游戏，瞄准新的内容平台机会

5 天前

爱可可-爱生活 · [CL]《Stronger Models are NOT Str-20241118055916

5 天前

爱可可-爱生活 · 本文提出了一种基于快速响应的LLM越狱防御新范式，通过“越狱扩增-20241117064706

6 天前

暴叔讲留学 · 年入三万怎么躺平

3 月前