注册登录

专栏名称: 包包算法笔记

数据挖掘、机器学习、深度学习、Kaggle竞赛分享与交流。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

钱江晚报 · 突发！5分钟暴涨超200% · 8 小时前

杭州日报 · 触目惊心！17岁男孩骑车时遭“割喉”！2天3 ... · 14 小时前

笛扬新闻 · 时间公布！柯桥这家医院，来了！ · 昨天

杭州日报 · 深夜通报：事发公海，1人死亡！刑事案件！ · 昨天

FM93交通之声 · “世纪婴儿”千千确认离世，年仅25岁 · 2 天前

今天看啥 › 专栏 › 包包算法笔记

OpenAI o1原理逆向工程图解

包包算法笔记 · 公众号 · · 2024-09-25 16:00

文章预览

知乎：https://zhuanlan.zhihu.com/p/721952915 OpenAI o1的推出称为横空出世不为过，尽管关于Q*、草莓等各种传闻很久了，用了强化学习增强逻辑推理能力这个大方向大家猜的也八九不离十，但是融合LLM和RL来生成Hidden COT，估计很少人能想到这点，而且目前看效果确实挺好的。 OpenAI奔向Close的路上越走越远，你要从o1官宣字面来看，除了“强化学习生成Hidden COT”外，基本找不到其它有技术含量的内容。Sora好歹还给出了个粗略的技术框架图，字里行间也透漏不少隐含的技术点，细心点总能发现很多蛛丝马迹，串起来之后整个背后的技术就若隐若现。而且，尽管目前有不少公开文献在用LLM+RL增强大模型的推理能力，但几乎找不到做Hidden COT生成的工作，所以可供直接参考的内容非常少，这为分析o1进一步增添了难度。那是否就没办法了呢？倒也不一定，如果多观察 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

钱江晚报 · 突发！5分钟暴涨超200%

8 小时前

杭州日报 · 触目惊心！17岁男孩骑车时遭“割喉”！2天3起，近期高发，一定要注意

14 小时前

笛扬新闻 · 时间公布！柯桥这家医院，来了！

昨天

杭州日报 · 深夜通报：事发公海，1人死亡！刑事案件！

昨天

FM93交通之声 · “世纪婴儿”千千确认离世，年仅25岁

2 天前

河北省发改委 · 优化营商环境 | 营造走在全国最前列的营商环境

1 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号