专栏名称: AI工程化
专注于AI领域(大模型、MLOPS/LLMOPS 、AI应用开发、AI infra)前沿产品技术信息和实践经验分享。
今天看啥  ›  专栏  ›  AI工程化

AI"破解"AI:来自Claude协助的OpenAI o1模型架构图

AI工程化  · 公众号  ·  · 2024-09-15 17:58

文章预览

中秋快乐!来一个轻松的话题。 自OpenAI o1发布以来,网络上迎来了新一轮技术解密热潮,大家都想这么强大的模型是如何炼成的。今天和大家分享一个破解o1奥秘的新思路。 reddit [1] 上有一个机智的网友脑洞大开,想出了个绝妙的主意:为啥不让AI来逆向AI呢?他找来了Claude 3.5,开始了一场别开生面的"AI解密AI"大冒险! 他是这么做的: 收集信息:搜罗了OpenAI的官方博客、员工推文,还有其他专家的评论。 喂饭AI:把收集到的信息都喂给了Claude。 展开对话:和Claude对话,不断调整问题。 得出结论:最后,Claude给出了一个可能的o1模型架构图。 Claude猜测的o1模型架构看起来是这样的: 核心是"思维链"机制,就像人类解题时的思考过程。 可能有个超大的"思维库",存储各种解题路径。 用了强化学习,不断优化决策过程。 能同时生成多个解题思路,然后 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览