Andrej Karpathy后悔放弃语言模型，却搞了多年强化学习，称是研究生涯最大的错误

夕小瑶科技说 · 公众号 · · 2024-11-18 14:52

文章预览

夕小瑶科技说分享来源 | 机器之心「这是有史以来最大、最令人困惑的研究生涯错误，」Andrej Karpathy 感叹道。上个周末，OpenAI 创始成员、研究科学家、原特斯拉前 AI 高级总监、AI 领域的大神 Andrej Karpathy 一直在后悔。后悔自己没有早点带领 OpenAI 开创大模型时代。是怎么一回事？看起来 Karpathy 认为当年早已认识到自回归语言模型的强大潜力，但却在很长一段时间里「误入歧途」，随大溜一起搞强化学习。 2013 年的 Atari RL 论文被认为是深度强化学习的开山之作：一个通用学习算法就发现了 Breakout 和许多其他游戏的最佳策略，看起来，在很多任务上我们只需要对其进行足够的改进和扩展，就可以构建出强大的 AI 模型了。我们也还记得，在 Karpathy 跳槽去到特斯拉一年后，2018 年 OpenAI 推出了 OpenAI Five，利用强化学习的方法在 Dota 2 游戏上开 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

北美留学生观察 · 拿自己的女儿做实验30年，这位匈牙利父亲培养出了世人惊叹的"神童三姐妹"

3 天前

北美留学生观察 · 国际学校择校圈烂透了？！

4 天前

上海科技 · 【2024浦江创新论坛】我在国际论坛讲开放麦 ——青年创新论坛Y HUB演讲嘉宾召集令！

3 月前

九芯智能 · 离线语音识别芯片让家用饮水茶吧机更智能

2 月前

21世纪经济报道 · 楼市大利好，降至史低！解读来了

1 周前