注册
登录
专栏名称:
InfoQ
有内容的技术社区媒体。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
新浪科技
·
【#抖音辟谣去年电商广告收入4000亿#:与 ...
·
13 小时前
新浪科技
·
【#复旦发文规范毕业论文AI使用#:禁止用于 ...
·
19 小时前
新浪科技
·
【#周鸿祎首部短剧演黑客##周鸿祎模仿向佐# ...
·
2 天前
新浪科技
·
【#长安汽车拟2026年交付无人配送车#,# ...
·
2 天前
新浪科技
·
【#第一批回家过年的年轻人已经就位# ...
·
6 天前
今天看啥
›
专栏
›
InfoQ
Kimi 背后的长文本大模型推理实践:以 KVCache 为中心的分离式推理架构
InfoQ
·
公众号
·
科技媒体
· 2024-09-20 16:57
文章预览
演讲嘉宾|唐飞虎 编辑 |蔡芳芳 策划 |AICon 全球人工智能开发与应用大会 在不久前举办的 AICon 全球人工智能开发与应用大会上,月之暗面高级研发工程师、开发者关系负责人唐飞虎发表了专题演讲“长文本大模型推理实践——以 KVCache 为中心的分离式推理架构”,分享介绍 Kimi 智能助手背后的推理加速方案,以及该方案在设计时所需要考虑的指标和在真实生产环境中部署的表现。 在 10 月 18 -19 日即将召开的 QCon 上海站上,我们专门策划了【 大模型基础设施与算力优化 】专场,并邀请到月之暗面推理系统负责人何蔚然进一步分享 Mooncake 分离式推理架构创新与实践,同时微软亚洲研究院软件开发工程师姜慧强将分享 《 长文本 LLMs 推理优化:动态稀疏性算法的应用实践 》,还有更多大模型训练推理的一手实践案例尽在本专题。欲了解更 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
新浪科技
·
【#抖音辟谣去年电商广告收入4000亿#:与事实严重不符,抖音广-20241129135642
13 小时前
新浪科技
·
【#复旦发文规范毕业论文AI使用#:禁止用于方案设计、正文生成、-20241129081000
19 小时前
新浪科技
·
【#周鸿祎首部短剧演黑客##周鸿祎模仿向佐#】周鸿祎首次参演的“-20241127193711
2 天前
新浪科技
·
【#长安汽车拟2026年交付无人配送车#,#长安汽车开展飞行汽车-20241127101000
2 天前
新浪科技
·
【#第一批回家过年的年轻人已经就位# #提前回家过年成打工人最新-20241123100551
6 天前
梨视频
·
无人驾驶出租车碰撞行人,“萝卜快跑”被指抢网约车饭碗,武汉交通局回应
4 月前
东莞本地宝
·
东莞大学生助学贷款已开始办理!办理指南看这里!
4 月前