文章预览
LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 1、[LG] Boosting Reward Model with Preference-Conditional Multi-Aspect Synthetic Data Generation 2、[CL] Shared Imagination:LLMs Hallucinate Alike 3、[LG] Shapley Pruning for Neural Network Compression 4、[LG] KAN or MLP:A Fairer Comparison 5、[CL] Multilingual Fine-Grained News Headline Hallucination Detection 摘要:面向偏好条件多方面合成数据生成的提升奖励模型、不同LLM会产生相似的幻觉、基于Shapley剪枝的神经网络压缩、KAN与MLP更公平的比较、多语种细粒度新闻标题幻觉检测 1、[LG] Boosting Reward Model with Preference-Conditional Multi-Aspect Synthetic Data Generation J Shen, R Xu, Y Jun, Z Qin… [Google Research† & Emory University] 面向偏好条件多方面合成数据生成的提升奖励模型 要点: 提出RMBoost,一种新的合成优先数据生成范式,用于训练高质量的奖励模型以调整大型语言模型。 与以前的方
………………………………