专栏名称: AI for Research
每天分享最新最热的Arxiv论文、一起来关注大模型、AIGC、AGI
目录
相关文章推荐
CHINADAILY  ·  China丨Monitoring ... ·  19 小时前  
CHINADAILY  ·  Z WEEKLY丨Young ... ·  2 天前  
CHINADAILY  ·  Business丨China ... ·  4 天前  
今天看啥  ›  专栏  ›  AI for Research

仅需100条样本即可实现LLM在未知数据分布上的泛化?数据规模对语言模型表现的影响:以微调翻译大模型为例...

AI for Research  · 公众号  ·  · 2024-09-07 12:32

文章预览

前言: 科研就像一场冒险,而看论文就是你的探险工具!只有通过深入阅读,才能找到宝藏,发现那些意想不到的科研奇遇哦! 1. 100 instances is all you need:通过在少量实例上测试预测新LLM在未见数据上的成功   标题: 100 instances is all you need: predicting the success of a new LLM on unseen data by testing on a few instances   相关领域: 模型评估   作者: Lorenzo Pacchiardi,  Lucy G. Cheke,  José Hernández-Orallo   分析: 论文探讨了如何预测大型语言模型的个体任务表现,实现高可靠性和高效评估。研究提出了一种方法,通过评估模型在少数参考实例上的表现,训练一个通用的评估器,预测模型在其他实例上的表现。实验在HELM-Lite和KindsOfReasoning数据集上进行,使用OpenAI模型评估了不同版本的GPT,结果表明,使用同一分布的少量实例训练的评估器,预测性能与使用大量实例训 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览