专栏名称: Ai学习的老章
长期跟踪关注统计学、数据挖掘、机器学习算法、深度学习、人工智能技术与行业发展动态,分享Python、机器学习等技术文章。回复机器学习有惊喜资料。
今天看啥  ›  专栏  ›  Ai学习的老章

大模型推理引擎之:SGLang

Ai学习的老章  · 公众号  ·  · 2025-04-10 17:31
    

文章预览

大家好,我是Ai学习的老章 简单介绍一个推理引擎SGLang 它也是DeepSeek官方推荐的推理引擎之一 Why SGLang 项目地址:https://github.com/sgl-project/sglang SGLang 是适用于大型语言模型和视觉语言模型的快速服务框架。它通过共同设计后端运行时和前端语言,与模型的交互更快、更可控。 核心功能包括: 快速后端运行时  :使用 RadixAttention 为前缀缓存、零开销 CPU 调度程序、连续批处理、标记注意力(分页注意力)、推测解码、张量并行、分块预填充、结构化输出和量化 (FP8/INT4/AWQ/GPTQ) 提供高效服务。 灵活的前端语言  :为编程LLM应用程序提供直观的界面,包括链式生成调用、高级提示、控制流、多模态输入、并行性和外部交互。 广泛的模型支持  :支持广泛的生成模型(Llama、Gemma、Mistral、QWen、DeepSeek、LLaVA 等)、嵌入模型(e5-mistral、gte、mcdse)和奖励 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览