专栏名称: 人工智能学派
人工智能学派专注于分享:GPT、AIGC、AI大模型、AI算力、机器人、虚拟人、元宇宙等AI+160个细分行业!
今天看啥  ›  专栏  ›  人工智能学派

2024腾讯AngelPTM大模型训练框架优化与实践支撑混元大模型训练的训练框架

人工智能学派  · 公众号  ·  · 2024-10-24 18:58
    

文章预览

如何下载资料? 微信扫下方二维码加入星球平台 【老会员续费特惠】 今天分享的是:2024腾讯AngelPTM大模型训练框架优化与实践支撑混元大模型训练的训练框架-薛金宝 报告共计:25页 该报告介绍了腾讯AngelPTM大模型训练框架的优化与实践,主要内容包括:首先阐述大模型发展趋势,如参数规模指数级增长、模态变化多样、MOE及更长Context Window应用等,同时面临显存需求大、网络通信量大、算力规模大等训练挑战。接着详细介绍AngelPTM框架,其突破低端卡限制,性能领先,产出混元万亿参数模型,训练和推理性能分别是业界开源框架的2.6倍和2.3倍,单个训练任务可突破万卡规模,GPU利用率高,成本下降。然后阐述框架的多项技术优化,如ZeROCache存储优化技术提升模型容量,多维并行加速训练效率,大规模计算通信流水线与低精度量化技术降低开销,MO ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览