注册
登录
专栏名称:
InfoQ
有内容的技术社区媒体。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
新浪科技
·
【#全国近8000家影城下调电影票价#】近日 ...
·
昨天
新浪科技
·
【#12306页面已陆续恢复##12306陆 ...
·
昨天
新浪科技
·
【#哪吒汽车官网无法访问#,显示“系统维护中 ...
·
昨天
新浪科技
·
【#小米汽车工厂开放对外参观预约##雷军宣布 ...
·
3 天前
新浪科技
·
【#曝苹果超薄机型目标厚度6.25mm##i ...
·
3 天前
今天看啥
›
专栏
›
InfoQ
Kimi 背后的长文本大模型推理实践:以 KVCache 为中心的分离式推理架构
InfoQ
·
公众号
·
科技媒体
· 2024-09-20 16:57
文章预览
演讲嘉宾|唐飞虎 编辑 |蔡芳芳 策划 |AICon 全球人工智能开发与应用大会 在不久前举办的 AICon 全球人工智能开发与应用大会上,月之暗面高级研发工程师、开发者关系负责人唐飞虎发表了专题演讲“长文本大模型推理实践——以 KVCache 为中心的分离式推理架构”,分享介绍 Kimi 智能助手背后的推理加速方案,以及该方案在设计时所需要考虑的指标和在真实生产环境中部署的表现。 在 10 月 18 -19 日即将召开的 QCon 上海站上,我们专门策划了【 大模型基础设施与算力优化 】专场,并邀请到月之暗面推理系统负责人何蔚然进一步分享 Mooncake 分离式推理架构创新与实践,同时微软亚洲研究院软件开发工程师姜慧强将分享 《 长文本 LLMs 推理优化:动态稀疏性算法的应用实践 》,还有更多大模型训练推理的一手实践案例尽在本专题。欲了解更 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
新浪科技
·
【#全国近8000家影城下调电影票价#】近日,部分影片进行了票价-20250106222300
昨天
新浪科技
·
【#12306页面已陆续恢复##12306陆续恢复可刷新查询#】-20250106162205
昨天
新浪科技
·
【#哪吒汽车官网无法访问#,显示“系统维护中”】昨日起陆续有网友-20250106090000
昨天
新浪科技
·
【#小米汽车工厂开放对外参观预约##雷军宣布小米汽车工厂开放对外-20250104120706
3 天前
新浪科技
·
【#曝苹果超薄机型目标厚度6.25mm##iPhone17Air-20250104074122
3 天前
福建电力交易中心
·
关于印发《福建省售电公司信用评价办法(试行)》的通知
3 月前