专栏名称: AI科技大本营
为AI领域从业者提供人工智能领域热点报道和海量重磅访谈;面向技术人员,提供AI技术领域前沿研究进展和技术成长路线;面向垂直企业,实现行业应用与技术创新的对接。全方位触及人工智能时代,连接AI技术的创造者和使用者。
今天看啥  ›  专栏  ›  AI科技大本营

提示工程迎来末日!OpenAI 深夜突发 o1 模型,自带思维链,可以推理和自我反思

AI科技大本营  · 公众号  ·  · 2024-09-13 12:20
    

文章预览

提示工程现在不仅无法提高推理性能,还有可能妨碍模型工作。 作者 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 北京时间 9 月 13 日凌晨 1 点左右,OpenAI 毫无预兆地揭露了神秘的“草莓”模型的真相,发布  OpenAI o1 模型的预览版。在这周的早些时候,外媒 The Information 曾爆料 OpenAI 会在“两周内”公布新模型,没想到他们“两天内”就火急火燎地发了出来,倒也没说错。 o1 模型主打的是像人类一样的 推理能力 , 尤其是它在数学和编程方面展现出来的强大实力,使其在国际数学奥林匹克竞赛(IMO)资格考试中解决了高达 83% 的问题,相比之下,GPT-4o 仅能解决 13% 的问题。 此外,o1 在 Codeforces 编程竞赛中的表现也同样出色,超越了 89% 的参赛者。 下面这个短视频,很好地演示了 o1 模型和当前的 GPT-4o 使用时的差异: o1 会在模型内部执行一个类似 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览