今天看啥  ›  专栏  ›  AI生成未来

2万字详述大语言模型对齐技术:RLIHF、RLAIF、PPO、DPO等

AI生成未来  · 公众号  ·  · 2024-07-29 00:30
    

文章预览

点击下方 卡片 ,关注“ AI生成未来 ” 请加小助理 加入AIGC技术交流群 备注公司/学校+昵称+研究方向, 广告勿扰 一、结论写在前面 论文标题:A Comprehensive Survey of LLM Alignment Techniques: RLHF, RLAIF, PPO, DPO and More 论文链接: https://arxiv.org/pdf/2407.16216 随着自监督学习的进步,预训练语料库中数万亿token的可用性,指令微调以及具有数十亿参数的大型Transformer的发展,大型语言模型(LLMs)现在能够生成对人类查询的事实性和连贯性响应。然而,训练数据的混合质量可能导致生成不希望的响应,这是一个重大挑战。 在过去两年中,从不同角度提出了各种方法来增强LLMs,特别是在与人类期望对齐方面。尽管有这些努力,但尚未有一篇综合调查论文对这些方法进行分类和详细说明。在这项工作中,论文旨在通过将这些论文分类为不同主题并详细解释每种对齐方 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览