还吹？OpenAI-o1又被打脸，看佛罗伦萨大学的K-SAT问题

AI修猫Prompt · 公众号 · · 2024-09-24 06:56

文章预览

点击上方蓝字关注我本文：6500字阅读 19分钟 OpenAI最新发布的o1-Preview模型号称具有Ph.D.级别的文本生成和数学问题解决能力，引发了科技界的广泛关注。然而，这个模型的真实能力到底如何？它是否真的能独立解决复杂的数学问题？我已连发三篇进行质疑！《别吹了，OpenAI-o1绝没吹的那么神，用斯坦福的这条Prompt，一样实现说话之前先思考》《真的别再吹o1模型是新的范式，看看清华的思维图(DoT)框架，LLM推理集大成者》最近，一项由佛罗伦萨大学（1321年成立）物理和天文学系（伽利略）的Raffaele Marino研究员进行的研究，从另一个角度佐证了我之前的判断，为我们揭示了一些令人深思的发现。目前，OpenAl-o1 Preview模型难以解决随机K-SAT问题，特别是对于较大的K值，即便是调用外部工具也仅得到错误输出，这凸显了 o1 Preview 模型解决问题能 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

TGB湖南人 · 【11.22复盘】村外点个狼烟，都能把鸡狗吓尿

昨天

TGB湖南人 · 【11.21复盘】谷歌都被制裁了，周五急需一根放量大阳线

2 天前

TGB湖南人 · 【11.20复盘】等根放量大阳线，千军万马来相见

3 天前

红星新闻 · 广东超40只宠物狗疑中毒死亡，包括20万粉丝网红抚慰犬“Eddie”和“Luna”！当地称数据还在上升，已立案调查

3 天前

红星新闻 · 广东超40只宠物狗疑中毒死亡，包括20万粉丝网红抚慰犬“Eddie”和“Luna”！当地称数据还在上升，已立案调查

3 天前

TGB湖南人 · 【11.18复盘】轻度复工，第一天市场就玩跷跷板

5 天前

女子戒色吧 · 异性缘太多，真不是什么好事

3 月前