专栏名称: 麻省理工科技评论
《麻省理工科技评论》杂志官方微博 源自麻省理工学院,关注即将商业化的创新,聚焦即将资本化的创业。
今天看啥  ›  专栏  ›  麻省理工科技评论

【可降低GPU内存的推理框架面世:韩国团队通过卸载键值缓存节约英-20250228191954

麻省理工科技评论  · 微博  ·  · 2025-02-28 19:19
    

文章预览

2025-02-28 19:19 本条微博链接 【可降低GPU内存的推理框架面世:韩国团队通过卸载键值缓存节约英伟达GPU内存,实现18.95倍注意力解码加速】 #DeepSeek# 通过工程手段实现了 #GPU# 的良好利用,这一做法似乎引起了全球 AI 研究人员的共鸣。 近日,来自 #韩国科学技术院# 和 DeepAuto.ai 公司的研究人员,研发出一款名为 InfiniteHiP 的大模型推理框架。 InfiniteHiP 能在推理过程中将键值(KV,Key - Value)缓存置于主机内存,从而能够 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览