腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

机器之心 · 公众号 · AI · 2024-05-24 12:42

文章预览

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com 本文作者袁镱博士是腾讯公司专家工程师，负责无量系统和一念LLM等机器学习训练和推理框架研发。以 OpenAI 的 GPT 系列模型为代表的大语言模型（LLM）掀起了新一轮 AI 应用浪潮，但是 LLM 推理的高昂成本一直困扰着业务团队。腾讯 PCG 机器学习平台中心自研了高性能 LLM 推理引擎：一念 LLM。在传统的算子融合，ContinousBatching 等推理加速技术的基础上，通过显存优化，异步调度和计算复用等技术，在相同精度的推理中，一念 LLM 相比 vLLM，TensorRT-LLM 等著名开源框架的推 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【GLiNER即服务：一个基于FastAPI的微服务，提供高效、-20240921173710

2 天前

黄建同学 · OCR 2.0，通用 OCR 理论（General OCR Th-20240920073702

4 天前

爱可可-爱生活 · 【自回归视觉生成资源列表：追踪最新的自回归视觉生成论文，提供丰富-20240917213524

6 天前

黄建同学 · #今日中秋愿月光所至万事胜意##中秋文案# 借ChatGPT生成-20240917203638

6 天前

黄建同学 · //@闵可夫会画图:程序员还是太老实，在干掉自己的饭碗的路上一去-20240917220007

6 天前