GPT-4批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开

深度学习与NLP · 公众号 · · 2024-06-29 00:00

文章预览

来源 | 新智元 ID | AI-era OpenAI最近的拖延症状逐渐严重，不仅GPT-5遥遥无期，前几天还宣布GPG-4o的语音功能将推迟一个月发布。或许是为了缓解广大网友的热切期待，OpenAI在今天放出了新模型CriticGPT，相当于GPT-4的「拐杖」。我们训练了一个模型CriticGPT，来捕获GPT-4生成代码中的错误。我们开始将此类模型集成到RLHF对齐管道中，以帮助人类监督AI执行困难的任务。值得注意的是，CriticGPT依旧是用GPT-4模型训练的，但被用于给GPT-4生成的代码「捉虫」，这似乎有点「自我闭环」的意思？推特网友迅速质疑，「我用石头摧毁石头」，矛盾得有点好笑。但也有人从另一个角度发现了华点：这难道就是模型自我提升的开始？官方发布的推文和博客中还没有提及CriticGPT何时会集成到ChatGPT中，但技术文章已经发布，而且又是一篇离职人员的遗留作品——由超 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

莓辣MAYLOVE · 《2025爱女实用指南》

2 天前

槽值 · 网易沸点工作室多岗位实习生招聘中

4 天前

槽值 · 网易沸点工作室多岗位实习生招聘中

5 天前

奇点网 · 《JAMA·精神病学》：科学家首次发现，加速间歇性TBS可有效改善难治性双相情感障碍患者抑郁症状，且大幅缩短治疗时间

3 月前

安全圈 · 【安全圈】这就很有意思：谷歌似乎要让Android系统可以直接运行Linux软件

1 月前