OpenAI“最后一篇”超级对齐论文发布：大小模型相互博弈，输出可读性up

量子位 · 公众号 · AI · 2024-07-18 12:49

文章预览

克雷西发自凹非寺量子位 | 公众号 QbitAI 让大小模型相互博弈，就能实现生成内容可读性的提升！这是来自OpenAI的正经研究，目标就是在保证准确率的同时，让模型输出更容易被人理解。用这种方法训练之后，人类对模型输出的判断准确率明显增长，速度也变得更快了。这项研究出自OpenAI已解散的“超级对齐”团队，模仿了多伦多大学学者与2021年提出的 “证明者-验证者”（Prover-Verifier）博弈。在训练过程中，OpenAI让大模型担任“证明者”，小模型作为“验证者”，让这两种身份展开一场相互较量。最终，大模型输出的结果不仅更易理解，自身的准确率也没有明显损失，小模型的判断水平也提高了。甚至论文作者之一、OpenAI研究员Yining Chen表示，这种方法“有可能使未来的模型比人类更聪明”。值得一提的是，超级对齐团队原负责人、RLH ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 今日推介(第1731期)：两位AI科学家能达成一致吗、信息增益最-20250405061612

9 小时前

MY聊审计 · 方方格子正式接入DeepSeek，无须单独注册API密钥就能用，并推出基于方方格子的大模型知识引擎LKE，从此用AI处理数据！

9 小时前

MY聊审计 · 方方格子正式接入DeepSeek，无须单独注册API密钥就能用，并推出基于方方格子的大模型知识引擎LKE，从此用AI处理数据！

9 小时前

新智元 · DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

22 小时前

黄建同学 · 吴恩达（Andrew Ng）关于“懒人式提示（Lazy Prom-20250404120532

昨天

宝玉xp · 提示词：把这张照片设计成一个3D风格的Q版APP图标，保留人物特-20250404112003

昨天

绿色青浦 · 便利境外人员在国内住宿，七部门发文→

8 月前

融云攻防实验室 · 漏洞预警瑞斯康达 wireless main.asp 未授权访问漏洞

5 月前

诺沃兰CMDRA · 直播预告 | 医疗器械临床评价路径选择

4 月前