专栏名称: 江大白

专业有趣的AI内容平台，关注后回复【算法】，获取45家大厂的《人工智能算法岗江湖武林秘籍》

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

化妆品观察品观 · YSL、SK-II、韩束在得物集体爆单：2人 ... · 2 天前

深圳宁南山 · 汽车工业与全国经济洗牌广州今年前三季度经济增 ... · 3 天前

黄岛主副业笔记 · 小红书出售实践家启示录，3个月收益8万！ · 5 天前

深圳大件事 · 3人受伤！深圳一工程发生中毒事故，原因披露 · 1 周前

亿邦动力 · 挖掘隐性需求、锚定细分赛道，8年创业成就百亿 ... · 1 周前

今天看啥 › 专栏 › 江大白

OpenAI o1详细拆解，完整训练过程逆向推演

江大白 · 公众号 · · 2024-09-27 08:00

文章预览

以下文章来源于微信公众号：夕小瑶科技说作者：夕小瑶科技说链接：https://mp.weixin.qq.com/s/2rK59hPV8C_PeDsT8Ii73w 本文仅用于学术分享，如有侵权，请联系后台作删文处理导读新浪微博机器学习团队 AI Lab 负责人张俊林，对OpenAI o1原理进行了非常干货的逆向工程图解。本文对此进行了详细总结归纳，希望对大家有所帮助。 OpenAI o1的推出称为横空出世不为过，尽管关于Q*、草莓等各种传闻很久了，用了强化学习增强逻辑推理能力这个大方向大家猜的也八九不离十，但是融合LLM和RL来生成Hidden COT，估计很少人能想到这点，而且目前看效果确实挺好的。 OpenAI奔向Close的路上越走越远，你要从o1官宣字面来看，除了“强化学习生成Hidden COT”外，基本找不到其它有技术含量的内容。Sora好歹还给出了个粗略的技术框架图，字里行间也透漏不少隐含的技术点， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

化妆品观察品观 · YSL、SK-II、韩束在得物集体爆单：2人运营，半年破亿，退货率仅1%

2 天前

化妆品观察品观 · YSL、SK-II、韩束在得物集体爆单：2人运营，半年破亿，退货率仅1%

2 天前

深圳宁南山 · 汽车工业与全国经济洗牌广州今年前三季度经济增长率仅有2%，其中第-20241113212013

3 天前

黄岛主副业笔记 · 小红书出售实践家启示录，3个月收益8万！

5 天前

黄岛主副业笔记 · 小红书出售实践家启示录，3个月收益8万！

5 天前

深圳大件事 · 3人受伤！深圳一工程发生中毒事故，原因披露

1 周前

亿邦动力 · 挖掘隐性需求、锚定细分赛道，8年创业成就百亿估值企业！

1 周前

传媒招聘那些事儿 · 【人工更新 · 在线全职表格】新闻媒体/内容运营/影视娱乐等超多全职岗位！等你来投！

4 月前

机器之心 · 陶哲轩支持！AI数学奥林匹克竞赛进步奖公布，奖金100多万美元

4 月前

红餐网 · 沪上阿姨旗下“沪咖”将独立运营，还要开放加盟

2 月前