RouteLLM：并非所有的任务都需要GPT-4

PaperAgent · 公众号 · · 2024-07-05 11:54

文章预览

LLM 在一系列任务中都表现出了卓越的能力，但从图1中的性能与成本图可以看出，它们的成本和能力存在很大差异。从广义上讲，能力更强的模型往往比能力较弱的模型更昂贵。这导致在现实世界中部署LLM时出现两难境地：将所有查询路由到最大、能力最强的模型可以获得最高质量的响应，但成本可能很高，而将查询路由到较小的模型可以节省成本，但可能会导致响应质量较低。图1：各种LLM的性能与成本图。性能由Elo在Chatbot Arena上测量，每百万to ken的成本假设为1:1的输入/输出比。通过两个模型之间的路由，理想情况下实现了比任何一个模型都更好的性能：成本比。 LLM最权威评估榜单维护者 lmsys 开源 RouteLLM （LLM路由），提供了一种解决方案，其中每个查询首先由一个系统处理，该系统决定将其路由到哪个 LLM。理想情况下，所有可以由较弱模型 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

莫理 · 勿忘国耻？我看你就是国耻！爱国免费游戏《血战上海滩》被搬运发售！

2 天前

莫理 · 勿忘国耻？我看你就是国耻！爱国免费游戏《血战上海滩》被搬运发售！

2 天前

文刀老湿 · SBC大放送！精选周黑倒计时，100张色卡即将入池，首个75+10选3，RTTK凯恩直升95（月进化盘点＋临期进化＋SBC攻略）

2 天前

晓衡的游戏开发圈 · 我才是那个吐槽最狠的！

5 天前

晓衡的游戏开发圈 · 我才是那个吐槽最狠的！

5 天前

E药经理人 · 强生再度斩获全球制药企业TOP1，品牌焕新蓄力创新发展

4 月前

达道晓歪 · 长沙2024年中考指标生录取分析系列之六：麓山国际的分校

3 月前