专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

单靠推理Scaling Law无法成就o1!无限推理token,GPT-4o依然完败

新智元  · 公众号  · AI  · 2024-09-29 13:03

文章预览

   新智元报道   编辑:编辑部 HXY 【新智元导读】 o1的秘诀,和全新的「推理Scaling Law」关系有多大?Epoch AI最近的对比实验表明,算法创新才是关键。 CoT铸就了o1推理王者。 它开创了一种推理scaling新范式——随着算力增加、更长响应时间,o1性能也随之增长。 这一点,为AI scaling开辟了新的可能性。 既然如此,若是将o1这一训练过程直接应用到所有LLM中,岂不皆是「推理王者」。 然而,研究机构Epoch AI发现,结果并不是这样的。 单纯的扩展推理计算,根本不能弥合o1-preview和GPT-4o之间的差距。 他们称,「虽然o1使用了逐步推理方法训练,但其性能改进,可能还存在其他的因素」。 o1的秘诀是什么? 上周,在o1-preview和o1-mini发布之后,Epoch AI研究人员开启了GPT-4o和o1-preview对比实验。 他们选择了一个具有挑战性的基准测试GPQA进行评估,其中包含STEM ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览