想跑千亿大模型？算力厂商放大招！CPU通用服务器成为新选择

量子位 · 公众号 · AI · 2024-08-01 14:27

文章预览

克雷西发自凹非寺量子位 | 公众号 QbitAI 千亿参数规模的大模型推理，服务器仅用4颗CPU就能实现！在一台CPU通用服务器上，浪潮信息成功跑通了102B大模型推理。如果推广开来，没有专用芯片的传统行业，不必更换硬件，也能用上AI了。 △ 浪潮信息通用服务器NF8260G7服务器成功运行千亿参数大模型这套方案以极低的延时，近乎实时地进行推理运算。如此之大的模型，只靠CPU运行，究竟是怎么实现的？ 4颗CPU带动千亿大模型？用CPU在单台通用服务器设备中运行大模型推理，特别是千亿参数的庞然大物，困难是可想而知的。要想高效运行千亿参数大模型，计算、内存、通信等硬件资源的需求量都非常巨大。内存方面，千亿参数大约需要200~300GB的显存空间才放得下。除了内存资源，千亿参数大模型在运行过程中，对数据计算、计算单元之间及计算 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【Awesome-LLM-Self-Improvement：精选-20241223131337

昨天

爱可可-爱生活 · 《爱可可微博热门分享(12.22)》爱可可微博热门分享(12-20241222224114

2 天前

黄建同学 · 回顾 OpenAI 和 ChatGPT 的 2024年！2024-20241222102634

2 天前

宝玉xp · 回复@我是_一颗菠菜:这个确实，医生在筛选结果上肯定也是专业的/-20241222013238

2 天前

量子位 · 谷歌版o1突发即屠榜！思考速度比所有模型快5倍，能解摩斯代码，数学物理秒秒钟解决

4 天前

上海证券报 · 一文看全！A股最新重大变化

6 月前

CSC研究房地产建筑团队 · 【中信建投建筑 | 2024年中期策略】关注财政精准发力，新质基建大有可为

5 月前

雪球 · 如果下半年这种大环境继续延续，大盘股可能个依然是资金关注的重点。-20240812153947

4 月前

心榜 · 把一切献给现在（10.3）

2 月前