注册
登录
专栏名称:
量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
【Awesome-LLM-Self-Impr ...
·
昨天
爱可可-爱生活
·
《爱可可微博热门分享(12.22)》 ...
·
2 天前
黄建同学
·
回顾 OpenAI 和 ChatGPT 的 ...
·
2 天前
宝玉xp
·
回复@我是_一颗菠菜:这个确实,医生在筛选结 ...
·
2 天前
量子位
·
谷歌版o1突发即屠榜!思考速度比所有模型快5 ...
·
4 天前
今天看啥
›
专栏
›
量子位
想跑千亿大模型?算力厂商放大招!CPU通用服务器成为新选择
量子位
·
公众号
·
AI
· 2024-08-01 14:27
文章预览
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 千亿参数规模的大模型推理,服务器仅用4颗CPU就能实现! 在一台CPU通用服务器上,浪潮信息成功跑通了102B大模型推理。 如果推广开来,没有专用芯片的传统行业,不必更换硬件,也能用上AI了。 △ 浪潮信息通用服务器NF8260G7服务器 成功运行千亿参数大模型 这套方案以极低的延时,近乎实时地进行推理运算。 如此之大的模型,只靠CPU运行,究竟是怎么实现的? 4颗CPU带动千亿大模型? 用CPU在单台通用服务器设备中运行大模型推理,特别是千亿参数的庞然大物,困难是可想而知的。 要想高效运行千亿参数大模型,计算、内存、通信等硬件资源的需求量都非常巨大。 内存方面,千亿参数大约需要200~300GB的显存空间才放得下。 除了内存资源,千亿参数大模型在运行过程中,对数据计算、计算单元之间及计算 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
【Awesome-LLM-Self-Improvement:精选-20241223131337
昨天
爱可可-爱生活
·
《爱可可微博热门分享(12.22)》 爱可可微博热门分享(12-20241222224114
2 天前
黄建同学
·
回顾 OpenAI 和 ChatGPT 的 2024年!2024-20241222102634
2 天前
宝玉xp
·
回复@我是_一颗菠菜:这个确实,医生在筛选结果上肯定也是专业的/-20241222013238
2 天前
量子位
·
谷歌版o1突发即屠榜!思考速度比所有模型快5倍,能解摩斯代码,数学物理秒秒钟解决
4 天前
上海证券报
·
一文看全!A股最新重大变化
6 月前
CSC研究房地产建筑团队
·
【中信建投建筑 | 2024年中期策略】 关注财政精准发力,新质基建大有可为
5 月前
雪球
·
如果下半年这种大环境继续延续,大盘股可能个依然是资金关注的重点。-20240812153947
4 月前
心榜
·
把一切献给现在(10.3)
2 月前