专栏名称: 孔某人的低维认知
孔某人低维认知中世界的投影,世界很复杂,但人的认知总是过于简单。 ####关注领域:LLM技术及应用、认知科学、决策规划、机器学习、提升生产率的技术方案等。
今天看啥  ›  专栏  ›  孔某人的低维认知

o1模型的技术分析(2):内部实现的更多信息

孔某人的低维认知  · 公众号  ·  · 2024-09-16 17:01

文章预览

上篇文章  o1模型的技术分析(1)——OpenAI亲自下场做的Agent推理模块的技术原型 1、官方AMA Hour提供的信息 OpenAI 官方在Twitter上的Ask Me Anything(AMA) Hour 相关链接 推文根节点: https: //x.com/OpenAIDevs/status/1834608585151594537 官方回答者列表: https: //x.com/OpenAIDevs/status/1834669821641761213 可以通过查看每个回答者的回复推文列表来遍历查看所有的信息。 第三方对OpenAI AMA Hour各个回答的整理,但不完整: https: //gist.github.com/thenameless7741/2a0438ffad028059b49480086a2a6c0c 1.1、重要信息整理 3个模型之间的具体关系: o1模型尚未发布,大概会在1个月内发布,能力会全方位强于o1-mini o1-preview只是o1模型的早期检查点,模型规模相同,但在STEM任务和代码方面不如o1-mini, 但在其他通用方面如推理和知识方面比o1-mini更好。STEM指科学(Science)、技术(Technology)、工程(Engineering)和数学 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览