专栏名称: 夕小瑶科技说

这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货，有小夕的回忆与日常，还有最重要的：萌！气！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

化妆品观察品观 · GMV超10亿，增速超100%，美妆白牌攻陷天猫 · 12 小时前

燕梳楼 · 我逢人就推的抗老面霜，吊打千元大牌，30天内 ... · 19 小时前

WWD 国际时尚特讯 · 焦点｜技术驱动创新，自然堂的又一步 · 22 小时前

小小包麻麻 · 换季干燥、敏感、泛红，CEMOY爆款返场，滋 ... · 昨天

化妆品观察品观 · 品观周报｜10月美妆零售额创新高/又一高端药 ... · 6 天前

今天看啥 › 专栏 › 夕小瑶科技说

张俊林详细拆解o1：OpenAI o1完整训练过程逆向推演

夕小瑶科技说 · 公众号 · · 2024-09-26 11:41

文章预览

夕小瑶科技说分享来源 | 张俊林@知乎新浪微博机器学习团队 AI Lab 负责人张俊林，对OpenAI o1原理进行了非常干货的逆向工程图解。知乎原贴：https://zhuanlan.zhihu.com/p/721952915 OpenAI o1的推出称为横空出世不为过，尽管关于Q*、草莓等各种传闻很久了，用了强化学习增强逻辑推理能力这个大方向大家猜的也八九不离十，但是融合LLM和RL来生成Hidden COT，估计很少人能想到这点，而且目前看效果确实挺好的。 OpenAI奔向Close的路上越走越远，你要从o1官宣字面来看，除了“强化学习生成Hidden COT”外，基本找不到其它有技术含量的内容。Sora好歹还给出了个粗略的技术框架图，字里行间也透漏不少隐含的技术点，细心点总能发现很多蛛丝马迹，串起来之后整个背后的技术就若隐若现（若对此感兴趣可看下我之前写的分析：技术神秘化的去魅：Sora关键技术逆 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

化妆品观察品观 · GMV超10亿，增速超100%，美妆白牌攻陷天猫

12 小时前

化妆品观察品观 · GMV超10亿，增速超100%，美妆白牌攻陷天猫

12 小时前

燕梳楼 · 我逢人就推的抗老面霜，吊打千元大牌，30天内不满意不要钱!

19 小时前

WWD 国际时尚特讯 · 焦点｜技术驱动创新，自然堂的又一步

22 小时前

WWD 国际时尚特讯 · 焦点｜技术驱动创新，自然堂的又一步

22 小时前

小小包麻麻 · 换季干燥、敏感、泛红，CEMOY爆款返场，滋养呵护、安心度过敏感期~

昨天

小小包麻麻 · 换季干燥、敏感、泛红，CEMOY爆款返场，滋养呵护、安心度过敏感期~

昨天

化妆品观察品观 · 品观周报｜10月美妆零售额创新高/又一高端药妆品牌闭店

6 天前

AI TIME 论道 · AI斗图神器：普通视频秒变meme，手绘动画轻松融入，了解一下？

3 月前

bnu 鸦马路 · 9月4日！2024第一学期北师大选课！不要错过鸦鸦子收录的1000条选课评价！

2 月前

哔哩哔哩 · 5岁二次元，在漫展杀疯了

1 月前