专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

GPT-4.5被DeepSeek 500倍吊打！基准测试全班垫底，OpenAI痛失护城河

新智元 · 公众号 · AI · 2025-03-01 14:20

文章预览

新智元报道编辑：编辑部 JHZ 【新智元导读】 GPT-4.5上线一天，已经引起了集体群嘲：这个模型彻头彻尾失败了，OpenAI已经陷入严重困境，失去护城河！有人算出，GPT-4.5比DeepSeek V3贵了500倍，性能却更差。有的权威AI预测者看完GPT-4.5，气得直接把AGI预测时间推后了……当然了，OpenAI并不这么认为。自从OpenAI发布GPT-4.5之后，Ilya这张图又开始火了。 GPT-4.5令人失望的表现，再次印证了Ilya这句话的含金量：预训练已经达到极限，推理Scaling才是未来有希望的范式。 GPT-4.5在基准测试上并没有提升，推理没有增强，只是变成了一个更易于合作、更有创造性、幻觉更少的模型。 GPT-4.5的「失败」更加证明，Ilya是对的。现在，各方评测都已经出炉，结果显示，OpenAI实在是太打脸了。从ARC-AGC的评估上来看，GPT-4.5几乎跟GPT-4o处于同一水平，智能上似乎没有 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博