文章预览
夕小瑶科技说 原创 作者 | 付奶茶 昨天凌晨,OpenAI发布了一项名为Prover-Verifier-Games(证明者-验证者博弈)的新研究! 这项研究的目的是 确保语言模型生成的文本易于理解,以提高它们在处理复杂任务(如解决数学问题)时的实用性 。 OpenAI的研究人员认为, 仅仅为了得到正确答案而优化强大模型的解题过程,可能会使生成的解决方案变得难以理解。而且在人类评估中,这样高度优化的解决方案甚至错误率更高!因此在AI生成文本中,不仅要追求正确性,还要注重清晰度和易于验证性 。 研究人员尝试用高级语言模型生成较弱模型容易验证的文本,来提升输出答案的可读性和验证性,为此OpenAI提出设计两个角色:“证明者”生成解决方案,“验证者”检查其准确性。 接下来和奶茶一起来看下怎么个事! 提高可读性 研究人员的灵感来自于小学数学问
………………………………