专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
今天看啥  ›  专栏  ›  斌叔OKmath

o1(即 Strawberry)的推理方式与以前的 LLM 有何-20240916072254

斌叔OKmath  · 微博  ·  · 2024-09-16 07:22

文章预览

2024-09-16 07:22 本条微博链接 o1(即 Strawberry)的推理方式与以前的 LLM 有何不同? “o1 模型引入了推理标记。模型使用这些推理标记来“思考”,分解对提示的理解并考虑生成响应的多种方法。生成推理标记后,模型会以可见的完成标记的形式生成答案,并从其上下文中丢弃推理标记。” ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览