专栏名称: 数薮智能
搜集、组织、学习、展示与大数据、自然语言处理和大语言模型相关的技术、方法、知识和成果
目录
相关文章推荐
今天看啥  ›  专栏  ›  数薮智能

逆向思维使大语言模型成为更强的推理者

数薮智能  · 公众号  ·  · 2024-12-20 20:23
    

文章预览

逆向思维在推理中起着至关重要的作用。人们不仅可以从问题到解决方案进行推理,还可以逆向推理,即从解决方案出发,向问题方向进行推理。这通常可以提高整体推理性能,因为这可以检查正向思维和逆向思维之间的一致性。为了让大语言模型(LLM)能够进行逆向思维,引入了逆向增强思维(REVTHINK),这是一个由数据增强和学习目标组成的框架。在REVTHINK中,通过从教师模型中收集结构化的正向-逆向推理来增强数据集,其中包括:(1)原始问题;(2)正向推理;(3)逆向问题;(4)逆向推理。然后,采用三个目标,以多任务学习的方式训练一个较小的学生模型:(a) 从问题中生成正向推理,(b) 从问题中生成逆向问题,(c) 从逆向问题中生成逆向推理。 原标题:Reverse Thinking Makes LLMs Stronger Reasoners 论文链接: https://arxiv.org/abs/2411.19865v1 一、主要贡献: 提出了 RE ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览