腾讯最新万亿参数异构MoE上线，技术细节首次曝光！权威评测国内第一，直逼GPT-4o

机器学习研究组订阅 · 公众号 · AI · 2024-09-12 18:58

主要观点总结

本文主要介绍了腾讯推出的新一代旗舰大模型——混元Turbo。该模型采用了国内率先的MoE结构，相较于上一代混元Pro模型，采用了全新的分层异构MoE结构，并在参数规模上保持万亿级别。混元Turbo在业界公认的benchmark指标上处于领先地位，并在国内第三方权威评测中夺得第一。文章还详细描述了混元Turbo的技术细节，包括Pretrain和Postrain阶段的技术特点，以及针对高质量文本创作、数学和逻辑推理等专项能力的强化。此外，该模型还具备AI搜索功能，并建立在腾讯自研的Angel机器学习平台和强大的算力基础设施之上。最后，文章提到混元Turbo已在元宝APP中面向所有C端用户开放。

关键观点总结

关键观点1: 混元Turbo是国内率先采用MoE结构的大模型，在参数规模上保持万亿级别。

混元Turbo采用了全新的分层异构MoE结构，相较于上一代模型有更优异的表现。

关键观点2: 混元Turbo在业界公认的benchmark指标上领先，并在国内第三方评测中夺冠。

该模型在Pretrain和Postrain阶段有独特的技术特点，并专项强化了高质量文本创作、数学和逻辑推理等能力。

关键观点3: 混元Turbo支持AI搜索功能，并建立在腾讯自研的Angel机器学习平台和强大的算力基础设施之上。

该平台采用了一系列优化策略，使得训练性能提升，成本下降，并且具备高效的推理能力。

关键观点4: 混元Turbo已经在元宝APP中面向所有C端用户开放。

该模型与腾讯生态体系全面连接，为用户提供丰富、权威的生态优质内容及全网信息。

文章预览

近期，腾讯混元推出新一代旗舰大模型——混元Turbo。作为国内率先采用MoE结构大模型的公司，腾讯继续在这一技术路线上进行技术创新。相较上一代混元Pro的同构MoE大模型结构，混元Turbo采用了全新的分层异构MoE结构，在参数总规模上依然保持万亿级。公开信息显示，当前混元Turbo模型在业界公认的benchmark指标上处于国内行业领先地位，与国外头部模型如GPT-4o等相比也处于第一梯队。另外，在刚刚发布的国内第三方权威评测机构评测中，混元Turbo模型位列国内第一。混元Turbo是如何做到如此快速的进步？背后技术细节首公开我们拿到了混元Turbo的技术解读，从Pretrain、Postrain和专项能力突破几个角度，深入展示了模型升级的秘密。首先，业界目前普遍公认，大模型Pretrain成功的关键秘诀之一是Scaling Law。可以简单理解为，训练数据量越大，模型 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博