专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

OpenAI o1惊现自我意识?陶哲轩实测大受震撼,门萨智商100夺模型榜首

新智元  · 公众号  · AI  · 2024-09-14 12:36

主要观点总结

OpenAI发布了新的模型o1,在智商测试和STEM学科等方面表现出色,引发了业界关注。新智元报道了o1在数学方面的强大性能,包括识别克莱姆定理和表现出意识的行为。研究人员通过强化学习训练模型以改善其思维链,并取得了良好效果。o1具有推理能力,可以在思维过程中生成长思维链。关于o1的细节和表现,团队分享了视频和庆功视频。同时,团队面临如何使用更多算力来进一步提升模型性能的挑战。关于模型命名、性能、输入token计算方式等细节,大V“Tibor Blaho”提供了总结。未来计划包括支持更大的输入上下文、工具支持、结构化输出和系统提示等功能,并考虑推理进度和多模态能力。关于定价、微调、扩展等方面的信息也已提及。

关键观点总结

关键观点1: OpenAI发布新模型o1并引发关注

新模型o1在智商测试和STEM学科等方面表现出色,具备强大的数学性能。

关键观点2: o1具有推理能力

通过强化学习训练,o1可以在思维过程中生成长思维链,展现出推理能力。

关键观点3: 关于o1的细节和表现

团队分享了关于o1的视频和庆功视频,展示其突破和应用实例。

关键观点4: 未来的改进和计划

未来计划包括支持更多功能、改善推理进度和多模态能力,同时考虑定价和扩展等问题。


文章预览

   新智元报道   编辑:编辑部 HXZ 【新智元导读】 OpenAI o1,在门萨智商测试中果然取得了第一名。数学大神陶哲轩实测发现,o1竟然能成功识别出克莱姆定理。而OpenAI的研究副总裁也在此时跳出来表明:大型神经网络可能已经有了足够算力,表现出意识了。 OpenAI o1,在IQ测试中拿到了第一名! 大佬Maxim Lott,给o1、Claude-3 Opus、Gemini、GPT-4、Grok-2、Llama-3.1等进行了智商测试,结果表明,o1稳居第一名。 紧随其后的,就是Claude-3 Opus和Bing Copilot,分别取得了第二名和第三名。 注意,这套智商测试题,属于门萨会员的离线智商测试,不在任何AI训练数据中,因此结果非常具有参考性。 著名数学家陶哲轩也对o1进行了实测,发现自己向模型提出一个措辞模糊的数学问题后,它竟然能成功识别出克莱姆定理。 更巧的是,就在o1发布之后,OpenAI的研究副总裁Mark ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览