注册登录

专栏名称: 大语言模型和具身智体及自动驾驶

讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

蛋先生工作室 · 最新淘汰鸡行情 · 8 小时前

电商行业 · 直播售假被重罚，这家公司摊上事了 · 13 小时前

老马那些事 · 菜鸟速递与大润发加深同城配送合作 ... · 16 小时前

老马那些事 · 菜鸟速递与大润发加深同城配送合作 ... · 16 小时前

蛋先生工作室 · 2024年12月24日最新蛋价（早报） · 2 天前

今天看啥 › 专栏 › 大语言模型和具身智体及自动驾驶

基准数据集做大语言模型路由

大语言模型和具身智体及自动驾驶 · 公众号 · · 2024-12-23 00:32

文章预览

23年9月来自MIT和MIT-IBM实验室的论文“Large Language Model Routing with Benchmark Datasets”。开源大语言模型 (LLM) 和基准数据集的数量正在迅速增长，可用于LLM性能比较。虽然有些模型在这些基准测试中占据主导地位，但没有一个模型通常能够在所有任务和用例中实现最佳准确率。这项工作的目的是，从一组模型中为新任务选择最佳 LLM。提出了一种新公式，其中基准数据集被重新用于学习 LLM 选择的“路由器”模型，并且该问题可以简化为二元分类任务集。分析从各种基准数据集中学习模型路由器的实用性和局限性，其中不断提高任何单一模型执行所有任务的性能。选择最佳模型或模型选择，是统计学和机器学习中的经典话题（Bishop & Nasrabadi，2006；Hastie，2009；Raschka，2018）。然而，典型的问题设置却大不相同：交叉验证等经典方法旨在估计在总体分布的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

蛋先生工作室 · 最新淘汰鸡行情

8 小时前

电商行业 · 直播售假被重罚，这家公司摊上事了

13 小时前

老马那些事 · 菜鸟速递与大润发加深同城配送合作已在41城提供半日达服务

16 小时前

老马那些事 · 菜鸟速递与大润发加深同城配送合作已在41城提供半日达服务

16 小时前

蛋先生工作室 · 2024年12月24日最新蛋价（早报）

2 天前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号