今天看啥  ›  专栏  ›  InfoQ

郑纬民院士携最佳论文出席 QCon:月之暗面 Kimi 大模型推理架构 Mooncake全网最权威解读

InfoQ  · 公众号  · 科技媒体  · 2025-03-28 19:30
    

文章预览

近日,中国工程院院士 / 清华大学教授 / 博士生导师郑纬民确认出席 QCon 北京大会发表题为《 关 于人工智能大模型的几点思考 》的主题演讲,并将分享 Kimi 幕后的大模型推理架构 Mooncake。 2025 年,人工智能加速从单模态向多模态发展,大模型在各行业广泛落地。在此进程中,人工智能大模型生命周期的各个环节对算力和存储产生了爆发式需求。数据获取时,海量小文件存储面临挑战;数据预处理开销成为大模型训练瓶颈;模型训练任务负载重、硬件出错概率高;模型微调需平衡数据规模与质量;模型推理存在算力困境。 这些问题该如何解决?在当前大模型产品中又如何落地相应解决方案?郑纬民将在本次演讲中结合 Kimi 幕后的大模型推理架构 Mooncake 对以上问题进行深入剖析。Kimi 从初期频繁算力扩容仍宕机,到如今能平稳承载高速增长的流量, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览