专栏名称: AI科技大本营

为AI领域从业者提供人工智能领域热点报道和海量重磅访谈；面向技术人员，提供AI技术领域前沿研究进展和技术成长路线；面向垂直企业，实现行业应用与技术创新的对接。全方位触及人工智能时代，连接AI技术的创造者和使用者。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

提示工程迎来末日！OpenAI 深夜突发 o1 模型，自带思维链，可以推理和自我反思

AI科技大本营 · 公众号 · · 2024-09-13 12:20

文章预览

提示工程现在不仅无法提高推理性能，还有可能妨碍模型工作。作者 | 王启隆出品丨AI 科技大本营（ID：rgznai100）北京时间 9 月 13 日凌晨 1 点左右，OpenAI 毫无预兆地揭露了神秘的“草莓”模型的真相，发布 OpenAI o1 模型的预览版。在这周的早些时候，外媒 The Information 曾爆料 OpenAI 会在“两周内”公布新模型，没想到他们“两天内”就火急火燎地发了出来，倒也没说错。 o1 模型主打的是像人类一样的推理能力，尤其是它在数学和编程方面展现出来的强大实力，使其在国际数学奥林匹克竞赛（IMO）资格考试中解决了高达 83% 的问题，相比之下，GPT-4o 仅能解决 13% 的问题。此外，o1 在 Codeforces 编程竞赛中的表现也同样出色，超越了 89% 的参赛者。下面这个短视频，很好地演示了 o1 模型和当前的 GPT-4o 使用时的差异： o1 会在模型内部执行一个类似 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

星嘉坡眼 · 官宣！五月天新加坡演唱会将有重量级神秘嘉宾

昨天

星嘉坡眼 · 财务总监“润”到新加坡，CEO被围堵4小时，中国一车企70亿窟窿待补

5 天前

小胖看房 · 浦东副中心500万级综合体盘，陆家嘴锦绣云澜四批次收官之作，预计下周开启认购！

5 月前

环球通信 · 重磅！国家数据局刘烈宏最新发声: “六”个要！

3 月前

电脑吧评测室 · 【Open Car】一年更比一年早的双11

2 月前

科普中国 · 我，PPT设计师，AI让我欲罢不能后，我闭嘴了 | AIGC新职业观察

2 月前