专栏名称: AI科技大本营

为AI领域从业者提供人工智能领域热点报道和海量重磅访谈；面向技术人员，提供AI技术领域前沿研究进展和技术成长路线；面向垂直企业，实现行业应用与技术创新的对接。全方位触及人工智能时代，连接AI技术的创造者和使用者。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

全面测试 OpenAI o1：逻辑推理天衣无缝，空间推理一碰就碎？

AI科技大本营 · 公众号 · · 2024-09-23 14:47

文章预览

GPT-4o 对象棋策略没有深刻的见解，但训练数据中却有足够多的国际象棋对局，所以至少可以猜测出一个看似合理的走法。相比之下，o1 试图扮演人类，真正地去分析棋盘状态。而它做得如此糟糕，以至于最终吐出了完全无意义的内容。作者 | Timothy B Lee 编译 | Eric Harrington 出品丨AI 科技大本营（ID：rgznai100）去年 11 月的时候，外媒报道 OpenAI 前首席科学家 Ilya Sutskever（当时他还没离职）领导的团队取得了技术突破，有关 OpenAI 的 Q* 项目的消息也因此传出，该项目旨在构建能解决复杂数学问题的模型。从此，全世界“妖魔化”了 Q* 的存在，有许多专家声称这就是 OpenAI 的 AGI（通用人工智能）项目，甚至还有一些 OpenAI 研究人员向董事会写了一封信，警告“ 一项强大的人工智能发现可能会威胁人类 ” 。这件事的结果就是，Ilya Sutskever 从此多了 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博