专栏名称: 孔某人的低维认知
孔某人低维认知中世界的投影,世界很复杂,但人的认知总是过于简单。 ####关注领域:LLM技术及应用、认知科学、决策规划、机器学习、提升生产率的技术方案等。
今天看啥  ›  专栏  ›  孔某人的低维认知

对o1 pro思考过程的技术分析(1)

孔某人的低维认知  · 公众号  ·  · 2025-01-05 20:39
    

文章预览

前言 本文关注的是o1 pro在推理阶段的过程探索,而并非如何训练出o1 pro模型。 本质上除了pretraining之外, 所有的训练过程都是为了模型使用阶段的方式而设计和优化的 。使用方式才是分析的主要目标,而post-training阶段的设计是为了优化使用阶段的表现而设计的。 关于降智: ChatGPT Pro账号仍然是可以被降智的,在测试o1 pro之前,请确认自己的账号没有被降智。没有被降智的o1 pro具有以下特征: [1] 在思考阶段会显示一个矩形框,而不是o1的风格。 [2] 在矩形框中会显示一个没有具体数字的进度条。 [3] o1 pro的回答是一次性快速给出的,而不是像o1一样流式输出。 1、o1 Pro的外部表现 o1 pro的最主要特征是它较长的思考时间,明显比o1要长。 而o1 pro的一个容易被忽视的重要特征是:o1 pro并非流式地生成最终回答,而是 在某个时间突然放出整个回答 。 如 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览