文章预览
RAG通过结合LLMs和检索器,利用搜索引擎增强了长篇问答( Long-form Question Answering )的质量。 尽管存在多种开源方法和商业系统,如Bing Chat,但生成的长形答案中存在两个关键问题: 事实性不足和逻辑清晰度不够。 为了解决这些问题,提出了一种 新颖的大纲增强生成器(outline-enhanced generator) ,以实现多面性答案的清晰逻辑生成,并构建了两个相应的数据集。接着,提出了一 种基于精心设计的事实性优化方法 ,该方法采用双细粒度的RLHF(Reinforcement Learning from Human Feedback)框架,包含不同粒度级别的自动评估和奖励建模。 展示了用于网络增强型长篇问答任务(LFQA)的LLM输入( 左上 ),现有的生成器( 左下 ),大纲增强生成器( 中间 )以及我们双细粒度的事实性优化方法( 右 )。在生成长答案之前,大纲增强生成器首先起草一个组织模式和
………………………………