中金 | 智算未来系列八：大模型持续迭代，算力需求不升反降？

中金点睛 · 公众号 · 金融 · 2024-05-29 07:35

文章预览

中金研究近期，深度求索（DeepSeek）发布第二代开源模型。其创新的模型结构，引发了市场对于算力需求究竟将如何演进的广泛讨论。我们认为，公司在模型架构侧的创新表观上实现了推理时大幅降低KV Cache访存开销且不增加额外计算量，看似对硬件有“降规”指引，但是，更低的推理成本会在中长期维度激发更多需求，反哺算力硬件市场增长。同时，我们认为大模型厂商推理环节的盈利能力正逐步改善，算力硬件需求持续性较高。点击小程序查看报告原文 Abstract 摘要 MLA创新架构使推理任务中占用的KV Cache大幅降低，提高硬件利用效率。在主流Transformer网络结构中，多头注意力机制Multi-Head Attention（MHA）是重要的组成部分。为了大幅简化无效重复计算，一般采用缓存MHA中Key和Value的方法（KV Cache）来优化推理任务效率。但随着输入上下文窗口长度 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

雪球 · 【3月11日午间涨停分析】今日午盘全市场共32股涨停，连板股总数-20250311115619

13 小时前

大道无形我有型 · 仅就电商而言，机会总是有的，多大不知道。-20250311065501

18 小时前

雪球 · 【竞价看龙头】市场焦点股永茂泰（10天6板）高开1.21%，机器-20250310094247

昨天

股妖姬 · 小金属涨疯了，概念股崛起！

昨天

股妖姬 · 小金属涨疯了，概念股崛起！

昨天

大道无形我有型 · 回复@开朗的旋风: 如果你不知道这是什么你不应该跟的，不然你早晚-20250309135050

2 天前

标杆精益 · IPQC（制程质量控制）巡检流程，就得这么干！【标杆精益】

7 月前

北京交通广播 · 无需材料即可绑定！北京的“10后”儿童家长注意啦

2 月前

南方地产观察 · 中建五子，竞逐广州

1 月前

东莞本地宝 · 今天12:00，东莞发放大额新年消费券！全市通用，不限商家！

1 月前