专栏名称: 芯榜
芯榜 — 中国芯片排行榜,用大数据理解半导体行业。(www.icrank.cn )芯片半导体集成电路IC微电子元器件晶圆排名榜单,服务芯片圈半导体圈中国半导体论坛社区
今天看啥  ›  专栏  ›  芯榜

服务器仅靠4颗CPU运行千亿大模型的“算法秘籍”

芯榜  · 公众号  ·  · 2024-07-30 13:19
    

文章预览

巨量模型的智能生产力正在逐步渗透到各行各业,但它们的部署和运行通常需要专用的AI加速卡,能否在CPU上运行千亿大模型,对千行百业智能化转型的深化与普惠至关重要。 日前,浪潮信息研发工程师基于2U4路旗舰通用服务器NF8260G7,通过张量并行、模型压缩量化等技术,解决了通用服务器的CPU计算资源不足、内存带宽瓶颈、缺乏大规模并行计算环境等问题, 在业内首次实现服务器仅依靠4颗CPU即可运行千亿参数“源2.0”大模型 。该方案建设成本更低, 首次投入可节约80%以上建设成本,且通用服务器功耗更低,运维更便捷,能够有效降低客户TCO 。 大模型推理的硬件需求:内存与带宽的双重考验 当前,大模型的推理计算面临多方面的挑战,制约了大模型服务成本的降低和应用落地。 首先是对内存容量的需求。大模型的推理过程中,需要将全部的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览