今天看啥  ›  专栏  ›  AI修猫Prompt

还吹?OpenAI-o1又被打脸,看佛罗伦萨大学的K-SAT问题

AI修猫Prompt  · 公众号  ·  · 2024-09-24 06:56

文章预览

点击上方 蓝字 关注我 本文:6500字阅读  19分钟   OpenAI最新发布的o1-Preview模型号称具有Ph.D.级别的文本生成和数学问题解决能力,引发了科技界的广泛关注。然而,这个模型的真实能力到底如何?它是否真的能独立解决复杂的数学问题?我已连发三篇进行质疑!《 别吹了,OpenAI-o1绝没吹的那么神,用斯坦福的这条Prompt,一样实现说话之前先思考 》《 真的别再吹o1模型是新的范式,看看清华的思维图(DoT)框架,LLM推理集大成者 》 最近,一项由佛罗伦萨大学(1321年成立)物理和天文学系(伽利略)的Raffaele Marino研究员进行的研究,从另一个角度佐证了我之前的判断,为我们揭示了一些令人深思的发现。目前,OpenAl-o1 Preview模型难以解决随机K-SAT问题,特别是对于较大的K值,即便是调用外部工具也仅得到错误输出,这凸显了 o1  Preview 模型 解决问题能 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览