郑纬民院士携最佳论文出席 QCon：月之暗面 Kimi 大模型推理架构 Mooncake全网最权威解读

InfoQ · 公众号 · 科技媒体 · 2025-03-28 19:30

文章预览

近日，中国工程院院士 / 清华大学教授 / 博士生导师郑纬民确认出席 QCon 北京大会发表题为《关于人工智能大模型的几点思考》的主题演讲，并将分享 Kimi 幕后的大模型推理架构 Mooncake。 2025 年，人工智能加速从单模态向多模态发展，大模型在各行业广泛落地。在此进程中，人工智能大模型生命周期的各个环节对算力和存储产生了爆发式需求。数据获取时，海量小文件存储面临挑战；数据预处理开销成为大模型训练瓶颈；模型训练任务负载重、硬件出错概率高；模型微调需平衡数据规模与质量；模型推理存在算力困境。这些问题该如何解决？在当前大模型产品中又如何落地相应解决方案？郑纬民将在本次演讲中结合 Kimi 幕后的大模型推理架构 Mooncake 对以上问题进行深入剖析。Kimi 从初期频繁算力扩容仍宕机，到如今能平稳承载高速增长的流量， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新浪科技 · 【#小米未接触到事故车##雷军称很多问题此刻没有办法回答#】4月-20250401224340

14 小时前

36氪 · 智谱发的「干活Agent」，不用邀请码

15 小时前

36氪 · 8点1氪：美的清仓小米股票合计套现近20亿；马斯克称火星将是美国的一部分；缅甸地震已致2056人死亡

昨天

InfoQ · 马斯克“逼疯”DOGE 团队：限时数月内“闪电式”重构6000万行代码，老程序员和IT专家吓傻了！

昨天

新浪科技 · 【#与辉同行获旅行社业务经营许可#】据天眼查App显示，近日，与-20250331111000

2 天前

善意取得是你老舅 · 【25客观】可撤销之重大误解是什么？

3 月前

善意取得是你老舅 · 【25客观】可撤销之重大误解是什么？

3 月前