注册
登录
专栏名称:
机器之心
专业的人工智能媒体和产业服务平台
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
机器之心
·
这才是真・开源模型!公开「后训练」一切,性能 ...
·
15 小时前
赛博禅心
·
来自 OpenAI 活动的随记
·
昨天
赛博禅心
·
来自 OpenAI 活动的随记
·
昨天
黄建同学
·
Suno v4 🔥正式发布↓ ...
·
3 天前
爱可可-爱生活
·
本文提出了一种名为LLC的通用神经符号回归工 ...
·
5 天前
黄建同学
·
可口可乐的 AI ...
·
6 天前
今天看啥
›
专栏
›
机器之心
用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构
机器之心
·
公众号
·
AI
· 2024-09-06 17:35
文章预览
机器之心报道 编辑:Panda 硬件发展速度跟不上 AI 需求,就需要精妙的架构和算法。 根据摩尔定律,计算机的速度平均每两年就会翻一倍,但深度学习的发展速度还要更快,如图 1 和 2 所示。 可以看到,AI 对算力的需求每年都以 10 倍幅度增长,而硬件速度每两年增长 3 倍、DRAM 带宽增长 1.6 倍、互连带宽则仅有 1.4 倍。 而大模型是大数据 + 大计算的产物,其参数量可达千亿乃至万亿规模,需要成千上万台 GPU 才能有效完成训练。 这些实际情况提升了人们对高性能计算(HPC)的需求。 为了获得更多计算资源,人们不得不扩展更多计算节点。这就导致构建 AI 基础设施的成本不断激增。降低这些成本具有很大的好处,构建成本和能耗高效型计算机集群也就自然成了一个热门的研究方向。 近日,DeepSeek(深度求索)发布了一份基于硬件发展的实际情况及 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
机器之心
·
这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct
15 小时前
赛博禅心
·
来自 OpenAI 活动的随记
昨天
赛博禅心
·
来自 OpenAI 活动的随记
昨天
黄建同学
·
Suno v4 🔥正式发布↓ #ai##音乐# 且通过了**图-20241120093850
3 天前
爱可可-爱生活
·
本文提出了一种名为LLC的通用神经符号回归工具,通过结合深度学习-20241118052721
5 天前
黄建同学
·
可口可乐的 AI 广告↓#ai##ai视频#ChatGPT 黄建-20241117203258
6 天前