专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开

新智元 · 公众号 · AI · 2024-06-28 13:36

文章预览

新智元报道编辑：乔杨【新智元导读】今天，OpenAI悄悄在博客上发布了一篇新论文——CriticGPT，而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练，但目的却是用来指正GPT-4的输出错误，实现「自我批评」。 OpenAI最近的拖延症状逐渐严重，不仅GPT-5遥遥无期，前几天还宣布GPG-4o的语音功能将推迟一个月发布。或许是为了缓解广大网友的热切期待，OpenAI在今天放出了新模型CriticGPT，相当于GPT-4的「拐杖」。我们训练了一个模型CriticGPT，来捕获GPT-4生成代码中的错误。我们开始将此类模型集成到RLHF对齐管道中，以帮助人类监督AI执行困难的任务。值得注意的是，CriticGPT依旧是用GPT-4模型训练的，但被用于给GPT-4生成的代码「捉虫」，这似乎有点「自我闭环」的意思？推特网友迅速质疑，「我用石头摧毁石头」，矛盾得有点好 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

机器之心 · 终于拿到内测！豆包-PixelDance真是字节视频生成大杀器

昨天

创业最前线 · AI落地产业的钥匙，为什么在百度的手里？

3 天前

创业最前线 · AI落地产业的钥匙，为什么在百度的手里？

3 天前

量子位 · 具身智能机器人隐藏冠军上新：领狗进家门，多模态AI那种

4 天前

AI前线 · 英特尔 28 年老员工崩溃控诉：公司文化烂透了！员工数 5 倍于对手、市值却不及5%，何至如此？

5 天前

黄建同学 · 斯坦福新鲜出炉的硬核LLM课程，1小时45分↓#ai##程序员#-20240924184652

6 天前