专栏名称: DataFunSummit
DataFun社区旗下账号,专注于分享大数据、人工智能领域行业峰会信息和嘉宾演讲内容,定期提供资料合集下载。
今天看啥  ›  专栏  ›  DataFunSummit

Xinference:企业级大模型推理和部署平台

DataFunSummit  · 公众号  ·  · 2025-01-04 18:00
    

文章预览

导读   近年来,大语言模型(LLM,后简称大模型)的发展突飞猛进。本文将分享未来速度公司在开源领域以及大模型落地过程中的核心产品——Xinference,其定位是一个真正企业级的、严肃的大模型推理和部署平台。公司致力于在 LLMOps(大模型运维)过程中,帮助大家降低部署的成本和难度,解决在落地过程中遇到的核心问题。 本次分享的主要内容包括以下几大部分: 1.  大模型推理基础 2.  大模型推理现状和困难 3.   Xinference:企业级推理和部署 4.  未来展望 分享嘉宾| 秦续业 杭州未来速度科技有限公司 联合创始人 编辑整理| 向隆 内容校对|李瑶 出品社区| DataFun 01 大模型推理基础 1.  LLM 推理概述 在当前这一波 AI 技术栈的发展中,大模型扮演着非常核心的角色。无论在其基础上构建何种应用,是以检索增强生成(RAG)为主的应用,还 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览