OpenAI新研究: "证明者-验证者博弈"让AI输出更易懂更可信

AI寒武纪 · 公众号 · · 2024-07-18 16:41

文章预览

OpenAI发布了一项新的研究成果,旨在提高大型语言模型输出的可读性和可验证性。这项名为"证明者-验证者博弈"的方法,不仅能够提高AI生成文本的准确性,还能使其更容易被人类理解和评估证明者-验证者博弈方法解释基本概念想象有两个AI玩家在玩一个游戏: 证明者(Prover): 一个聪明的AI,负责解决问题‍ 验证者(Verifier): 一个没那么聪明的AI,负责检查答案‍ 目标是让证明者学会用验证者能理解的方式解释问题‍ 游戏规则证明者解决一道数学题验证者检查答案是否正确如果验证者能理解并确认答案正确,证明者就赢了训练过程训练分为多个回合,每个回合包括两个阶段: 验证者训练: 给验证者看很多正确和错误的答案教它分辨对错证明者训练: 让证明者扮演"好人"和"坏人"两个角色好人角色: 尝试给出正确且容易理解的答案坏人角色: 尝试给出错 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博