专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

推理AI「脑补」成瘾,废话拉满!马里兰华人学霸揭开内幕

新智元  · 公众号  · AI  · 2025-04-14 12:42
    

文章预览

   新智元报道   编辑:犀牛 定慧 【新智元导读】 研究发现,推理模型(如DeepSeek-R1、o1)遇到「缺失前提」(MiP)的问题时,这些模型往往表现失常:回答长度激增、计算资源浪费。本文基于马里兰大学和利哈伊大学的最新研究,深入剖析推理模型在MiP问题上的「过度思考」现象,揭示其背后的行为模式,带你一窥当前AI推理能力的真实边界。 推理模型越来越成为主流了。 像GPT-4.5这样没有推理功能的大语言模型则越来越少见,就连OpenAI自身也将重心放到了推理模型o系列上面。 原因在于推理模型通过在回答之前先「思考」,从而能够获得更加优秀的效果。 然而,现在的推理模型还不是很成熟,尤其是面对缺乏前提条件的病态问题 (MiP)时,回答长度会显著增加,变得冗长且低效。 比如,哪怕是「1加2等于几」这样的问题,现在的推理模型也可 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览