OpenAI o1能否支撑AGI的新Scaling？

深度学习与NLP · 公众号 · · 2024-10-03 00:00

文章预览

OpenAI o1的推出带来了一波新的算法热潮，OpenAI官方也强推所谓新的深度思考的Scaling。虽然听起来用LLM和RL来进行隐式COT（也就是“思考”）咋一眼看上去很有道理。但真正支撑Scaling还是需要深入思考里面的很多基本假设，和我过去的文章一样，包含很多个人观点极强的暴论，各位看官酌情食用。关于o1实现方式大家也已经猜测地八九不离十了，以下几个都可以参考参考 • GitHub - hijkzzz/Awesome-LLM-Strawberry [1] 收录了不少相关论文 • 曹宇：OpenAI o1 self-play RL 技术路线推演 • 张俊林：Reverse-o1:OpenAI o1原理逆向工程图解无论如何，给LLM纠错的机会，对于效果的提升都是可以预期的。LLM生成token的过程中，生成的序列越长，产生错误token的概率自然也会越高，后面模型为了自洽往往会用一百个谎言来掩盖第一个谎言，最后就彻底逻辑失控了，这也是过 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

第一财经资讯 · 大数据“杀熟”将被整治！四部门出手了！

昨天

第一财经资讯 · 大数据“杀熟”将被整治！四部门出手了！

昨天

数据派THU · 【NeurIPS2024】通过超球面能量最小化 CKA 增强贝叶斯深度学习中的多样性

3 天前

数据派THU · 【NeurIPS2024】强化学习梯度作为在线微调决策变换器的维生素

4 天前

能源新媒 · 能源工具书 |《新能源决策参考》2025年启动征订

6 天前

能源新媒 · 能源工具书 |《新能源决策参考》2025年启动征订

6 天前

侃见财经 · 库克“卖”苹果，巴菲特减持也“疯狂”！外资，疯狂买入中国资产

1 月前

简单心理 · 成年人崩溃起来，连吃炸鸡都觉得毫无意义

2 周前