今天看啥  ›  专栏  ›  zartbot

致敬小镇做题家的OpenAI o1

zartbot  · 公众号  ·  · 2024-09-17 20:37

文章预览

OAI的草莓从去年11月开始炒作Q*, 已经预热了快一年了, 似乎伴随着最近Cursor+Claude的压力, 以及最近一轮OAI融资, 把o1放出来了. 本以为是给微软 Copilot:Wave2 [1] 预热的,但有点失望的是Copilot还是基于GPT-4o. 作为一个数奥/信奥退役选手, 对于o1是否真的有通向AGI的路径来做点分析. 然后针对金融口的朋友谈谈ScalingLaw提供的市场流动性, 再针对云和硅工朋友谈谈基础设施演进的需求. 而具体的算法部分, 后面还是在 《大模型的数学基础》 这个专题中单独再更新一篇.本文目录如下: 1.  LLM = 自回归的Large Language Monkeys 1.1 . 从预层范畴看Scaling Law的本质 1.2 . 训练Scaling Law的瓶颈 1.3 . 训练Scaling Law的本质是给市场注入流动性 2.  Chain-of-Thought 2.1  从一个无趣例子开始 2.2  自动的隐式CoT? 新的Scaling Law 2.3  Post Training Scaling Law 2.4  Inference Scaling Law 3.  小镇做 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览