OpenAI超级对齐团队再发「绝唱」！首提「证明者-验证者」博弈，训练GPT说人话

机器学习研究组订阅 · 公众号 · AI · 2024-07-18 17:16

文章预览

不知道你有没有过这样的经历：碰到一道做不出的数学题，于是丢给ChatGPT。结果一通生成之后，ChatGPT的「不知所云」让你从之前的略有头绪瞬间变成完全迷茫。不管它是对是错，反正人类是看不懂了。提高LLM的数学和推理能力是最近研究关注的焦点，但同样重要的是，确保模型生成可理解的文本。否则即使答案正确，99%的人类都理解不了，也不能让LLM真正协助我们处理复杂任务。 OpenAI近期发表的一篇论文就旨在研究并解决模型性能和可读性（legibility）之间的平衡。论文地址：https://openai.com/index/prover-verifier-games-improve-legibility/ 和之前发出来的两篇一样，这次又是Jan Leike的库存作品，但共同一作是两位在职研究员Jan Hendrik Kirchner和Yining Chen。估计超级对齐团队的「遗作」够OpenAI发一阵子了通过优化提升可读性论文发现，如果仅仅针对答案正确性 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

量子位 · 乌镇最火AI议题，原来答案藏在这份报告里

17 小时前

爱可可-爱生活 · 【Awesome-Efficient-MoE：专注于高效混合专家-20241123160520

2 天前

宝玉xp · 接之前 v0.dev 提示词的分析网页链接，“v0 will-20241123144440

2 天前

机器之心 · 这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

2 天前

机器之心 · 高通的自研架构芯片，正在整合生成式AI世界

6 天前

水电十四局国际业务快讯 · 党建小课堂 | 图解《中国共产党纪律处分条例》——关于共同故意违纪的处理规定

5 月前