注册登录

专栏名称: 阿里云基础设施

为了永不停机的计算服务

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

目录

相关文章推荐

中国基金报 · A股首现阿拉伯语年报摘要！ · 18 小时前

中国基金报 · 机械巨头，赴港上市方案初定！ · 2 天前

中国基金报 · 2000亿券商资管总经理离任！ · 2 天前

今天看啥 › 专栏 › 阿里云基础设施

基于Knative快速部署DeepSeek-R1

阿里云基础设施 · 公众号 · · 2025-02-20 17:00

文章预览

传统的基于GPU利用率的弹性伸缩策略无法准确反映大模型推理服务的实际负载情况，即使GPU利用率达到了100%，也不一定表明系统正处在高负荷运行状态。Knative提供的自动扩缩容机制KPA（Knative Pod Autoscaler）能够根据QPS或RPS来调整资源分配，更直接地反映推理服务的性能表现。本文以DeepSeek-R1模型、GPU类型为A10卡为例，介绍如何在Knative中部署一个DeepSeek-R1推理服务。 DeepSeek-R1是一个由深度求索人工智能公司（DeepSeek AI）开发的大型语言模型（LLM）系列，专注于高性能、高效率的自然语言处理任务。它是DeepSeek公司推出的第一代（R1）模型，旨在为企业和开发者提供强大的语言理解和生成能力。准备 • 已在ACK集群中部署Knative，请参见部署Knative。 • 已部署使用ECI资源所需的ack-virtual-node组件，请参见部署ack-virtual-node组件。部署DeepSeek-R1模型创建Knativ ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

中国基金报 · A股首现阿拉伯语年报摘要！

18 小时前

中国基金报 · 机械巨头，赴港上市方案初定！

2 天前

中国基金报 · 2000亿券商资管总经理离任！

2 天前

波段肺鱼 · 1天亏掉25.8%，他怎么做到的？

9 月前

水电十四局国际业务快讯 · 香港钻石山项目隧洞明挖段主体结构首仓混凝土浇筑完成

7 月前

无时尚中文网 · 奢侈品世纪大案：Coach和MK的竞争、消耗、虚假、无能和瓦解

6 月前

神外前沿 · 第955期专访 | 昆医大附一院任仲坤：DBS手术量逐年增加电极植入时的麻醉深度如何控制在最佳状态

6 月前

新浪科技 · 【#赛力斯前三季度营收超千亿#，净利润预计35-41亿元】赛力斯-20241010225504

5 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号