文章预览
总第551 篇 2023年 第003篇 面对在线推理服务使用的GPU资源不断增加、GPU利用率普遍较低的挑战,美团视觉研发团队决定通过模型结构拆分和微服务化进行优化,他们提出了一种通用高效的部署架构,来解决这种常见的性能瓶颈问题。 以“图像检测+分类”服务为例,优化后的服务压测性能指标GPU利用率由40%提升至100%,QPS也提升超过3倍。本文将会重点介绍推理服务部署架构优化的工程实践,希望对大家能有所帮助或启发。 0. 导读 1. 背景 2. 视觉模型服务的特点与挑战 2.1 模型优化工具与部署框架 2.2 视觉模型特点 2.3 视觉推理服务面临的问题与挑战 3. GPU服务优化实践 3.1 图像分类模型服务优化 3.2 图像“检测+分类”模型服务优化 4. 通用高效的推理服务部署架构 5. 总结与展望 0. 导读 美团视觉面向本地生活服务,在众多场景上落地应用了文字识别、
………………………………