讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

LLM-BLENDER:使用成对排名和生成式融合来集成大语言模型

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-12-12 00:04
    

文章预览

23年6月来自A2I、USC和浙江大学的论文“LLM-BLENDER: Ensembling Large Language Models with Pairwise Ranking and Generative Fusion”。 LLM-BLENDER是一个集成框架,旨在利用多个开源大语言模型 (LLM) 的不同优势来实现始终如一的卓越性能。框架由两个模块组成:PAIRRANKER 和 GENFUSER,其说明了不同示例的最佳 LLM 可能存在显著差异。PAIRRANKER 采用专门的成对比较方法来区分候选输出之间的细微差异。它联合编码输入文本和一对候选,使用交叉注意编码器来确定更优的那个。结果表明,PAIRRANKER 与基于 ChatGPT 的排名表现出最高的相关性。然后,GENFUSER 旨在合并排名靠前的候选,利用优势并减轻弱点,产生改进的输出。为了促进大规模评估,引入了一个基准数据集 MixInstruct,一个多指令数据集的混合,其具有 oracle 成对比较。 由于数据、架构和超参的不同,开源 LLM 表现出不同的优 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览