今天看啥  ›  专栏  ›  微软亚洲研究院

大语言模型应用如何实现端到端优化?

微软亚洲研究院  · 公众号  · AI  · 2024-07-25 17:09
    

文章预览

(本文阅读时间:10分钟) 编者按:基于大语言模型(LLMs)开发的应用目前主要使用公共 LLMs 服务提供的 API 进行,但是这些 LLMs 服务的 API 设计以请求为中心,缺乏应用级信息,难以有效优化整个应用流程,影响任务的端到端性能。为此,微软亚洲研究院的研究员们开发了一个专注于 LLMs 应用端到端体验的服务系统 Parrot,它具有减少网络延迟、提高吞吐量、减少冗余计算等优势。Parrot 可以通过引入语义变量,向公共 LLMs 服务公开请求间关系,从而开辟了 LLMs 应用端到端性能优化的空间。相关论文已被计算机系统领域顶级学术会议 OSDI 2024 收录。 大语言模型(LLMs)以其卓越的语言理解能力引领了一场应用开发领域的范式转变。在新兴范式中,一个或多个应用实体,被称为 AI 代理(AI  agent)或 AI 智能副驾驶(AI co-pilot ) ,通过自然语言(即“提 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览