文章预览
逆向思维在推理中起着至关重要的作用。人们不仅可以从问题到解决方案进行推理,还可以逆向推理,即从解决方案出发,向问题方向进行推理。这通常可以提高整体推理性能,因为这可以检查正向思维和逆向思维之间的一致性。为了让大语言模型(LLM)能够进行逆向思维,引入了逆向增强思维(REVTHINK),这是一个由数据增强和学习目标组成的框架。在REVTHINK中,通过从教师模型中收集结构化的正向-逆向推理来增强数据集,其中包括:(1)原始问题;(2)正向推理;(3)逆向问题;(4)逆向推理。然后,采用三个目标,以多任务学习的方式训练一个较小的学生模型:(a) 从问题中生成正向推理,(b) 从问题中生成逆向问题,(c) 从逆向问题中生成逆向推理。 原标题:Reverse Thinking Makes LLMs Stronger Reasoners 论文链接: https://arxiv.org/abs/2411.19865v1 一、主要贡献: 提出了 RE
………………………………