专栏名称: 图灵人工智能

人工智能及其他科技学术前沿、机器学习、图像识别、语音识别、自动驾驶、自然语言处理、脑机接口、云计算、大数据、物联网、机器人、天文物理、生物科学、数学、区块链、比特币、计算机等学术前沿知识、报告、讲座等介绍。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

前OpenAI联创、ChatGPT负责人John Schulman：大模型的升级秘诀

图灵人工智能 · 公众号 · · 2024-08-09 00:00

文章预览

8月6日，OpenAI联合创始人、ChatGPT架构师John Schulman宣布离职，将加入另一家由前OpenAI员工Dario Amodei创办的大模型公司Anthropic。近9年前，Schulman在研究生毕业后加入OpenAI，成为创始团队的一员。他是深度强化学习的早期先驱之一，很多人不知道的是，他也是ChatGPT项目的负责人，是他领导了ChatGPT的秘密武器RLHF（人类反馈的强化学习）技术的研究与开发。在负责ChatGPT之前，他发明了广泛应用的近端策略优化算法（PPO），这实际上也是ChatGPT训练的一部分。他还发明了信任区域策略优化（TRPO），对OpenAI Gym、OpenAI Benchmark以及现代深度学习时代的许多元学习算法作出了重要贡献。值得一提的是，其博士导师是强化学习领域开拓者、加州大学伯克利分校教授Pieter Abbeel。 Schulman兼具研究视野，又有丰富的工程实践基础。从硕士阶段开始，他就开始研究强化 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

6 小时前

成方三十二 · “行行行行行行行”“乐乐乐乐乐乐乐”……

5 天前

供应链金融 · 2025第十届“中国供应链金融行业标杆大奖”申报已开启！

5 天前

超级单品 SP · 怡颗莓：入华十年，火箭式增长

8 月前

BlueNote爵士乐俱乐部 · 撼动爵士届的千禧代表 Grace Kelly 即将引爆 Blue Note 舞台！

5 月前

弗雷赛斯 · 最高影响因子51.27，价格却只有市场价1/2！弗雷赛斯“润色”将继续不忘初心！

2 月前