对o1 pro思考过程的技术分析（1）

孔某人的低维认知 · 公众号 · · 2025-01-05 20:39

主要观点总结

本文主要对o1 pro在推理阶段的过程进行技术分析，关注其非流式输出答案的方式，并探讨其可能的目的和实现方式。文章还提及o1 pro的其他特性，如结构化思考、语义分段进度展示等，并与其他可能性如多路推理、canvas方式进行了对比和讨论。

关键观点总结

关键观点1: o1 pro的外部表现及主要特征

o1 pro的最主要特征是它较长的思考时间，明显比o1要长。其主要表现为在某个时间突然放出整个回答，而非流式生成。这涉及到一个结构化思考的过程，可能存在一个反思阶段，对回答进行分析和可能的改进。

关键观点2: o1 pro的实现方式分析

对于o1 pro的实现方式，文章分析了几个可能性，包括增加风控审核环节、结构化思考过程、基于message的workflow等。作者倾向于内部模型在生成回答后可能进行一个检查阶段，如果需要改进则继续生成第二轮的思考过程。

关键观点3: 关于多路推理和canvas方式的讨论

文章排除了多路推理的可能性，并探讨了其他可能性如canvas方式。作者认为这种方式虽然可以实现，但较为复杂且没有特别的必要性。

关键观点4: 结语

文章总结了关于o1 pro的技术分析，并提到未来可能的发现和思考。同时提供了与读者的交流机会和联系方式。

文章预览

前言本文关注的是o1 pro在推理阶段的过程探索，而并非如何训练出o1 pro模型。本质上除了pretraining之外，所有的训练过程都是为了模型使用阶段的方式而设计和优化的。使用方式才是分析的主要目标，而post-training阶段的设计是为了优化使用阶段的表现而设计的。关于降智： ChatGPT Pro账号仍然是可以被降智的，在测试o1 pro之前，请确认自己的账号没有被降智。没有被降智的o1 pro具有以下特征： [1] 在思考阶段会显示一个矩形框，而不是o1的风格。 [2] 在矩形框中会显示一个没有具体数字的进度条。 [3] o1 pro的回答是一次性快速给出的，而不是像o1一样流式输出。 1、o1 Pro的外部表现 o1 pro的最主要特征是它较长的思考时间，明显比o1要长。而o1 pro的一个容易被忽视的重要特征是：o1 pro并非流式地生成最终回答，而是在某个时间突然放出整个回答。如 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博