GPT-4批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开

机器学习研究组订阅 · 公众号 · AI · 2024-06-28 20:06

文章预览

OpenAI最近的拖延症状逐渐严重，不仅GPT-5遥遥无期，前几天还宣布GPG-4o的语音功能将推迟一个月发布。或许是为了缓解广大网友的热切期待，OpenAI在今天放出了新模型CriticGPT，相当于GPT-4的「拐杖」。我们训练了一个模型CriticGPT，来捕获GPT-4生成代码中的错误。我们开始将此类模型集成到RLHF对齐管道中，以帮助人类监督AI执行困难的任务。值得注意的是，CriticGPT依旧是用GPT-4模型训练的，但被用于给GPT-4生成的代码「捉虫」，这似乎有点「自我闭环」的意思？推特网友迅速质疑，「我用石头摧毁石头」，矛盾得有点好笑。但也有人从另一个角度发现了华点：这难道就是模型自我提升的开始？官方发布的推文和博客中还没有提及CriticGPT何时会集成到ChatGPT中，但技术文章已经发布，而且又是一篇离职人员的遗留作品——由超级对齐的scalable oversight团 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

人工智能那点事 · 自导自演炒作偷拍，500万粉丝网红被抓，曾称“发现民宿针孔摄像头后被围堵”，网友怒了……

12 小时前

机器之心 · 2024即将结束，中国AI应用支棱起来了吗？这家公司交出95分答卷

昨天

爱可可-爱生活 · 【PhoenixOS：一款操作系统级别的GPU状态保存和恢复工具-20241225135616

3 天前

爱可可-爱生活 · [CL] A Survey of Query Optimizat-20241225060333

3 天前

宝玉xp · //@翻译驴://@刘昕RUC:大爷是好大爷，只是这相关部门（领-20241225045641

3 天前

纯银V · 这是我三年来最好的一篇产品（行业）分析。低增长时代的产品经营逻辑-20240715100330

5 月前