专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

推理AI「脑补」成瘾，废话拉满！马里兰华人学霸揭开内幕

新智元 · 公众号 · AI · 2025-04-14 12:42

文章预览

新智元报道编辑：犀牛定慧【新智元导读】研究发现，推理模型（如DeepSeek-R1、o1）遇到「缺失前提」（MiP）的问题时，这些模型往往表现失常：回答长度激增、计算资源浪费。本文基于马里兰大学和利哈伊大学的最新研究，深入剖析推理模型在MiP问题上的「过度思考」现象，揭示其背后的行为模式，带你一窥当前AI推理能力的真实边界。推理模型越来越成为主流了。像GPT-4.5这样没有推理功能的大语言模型则越来越少见，就连OpenAI自身也将重心放到了推理模型o系列上面。原因在于推理模型通过在回答之前先「思考」，从而能够获得更加优秀的效果。然而，现在的推理模型还不是很成熟，尤其是面对缺乏前提条件的病态问题（MiP）时，回答长度会显著增加，变得冗长且低效。比如，哪怕是「1加2等于几」这样的问题，现在的推理模型也可 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · 回复@刘群MT-to-Death:主要还是现在画图模型和语言能力-20250428010517

昨天

爱可可-爱生活 · 【[347星]Deebo-prototype：AI开发者的调试神-20250427151033

昨天

爱可可-爱生活 · 晚安～ #晚安# -20250426225457

2 天前

爱可可-爱生活 · 【[176星]Sbnb Linux：为AI计算机量身打造的极简L-20250426205403

2 天前

宝玉xp · 网友说想生成怀抱美女的图片，怎么也生成不了，其实很简单的，模仿泰-20250426150703

2 天前

羊城晚报金羊网 · 37㎡宿舍住14人？有学生“3天未能洗澡”！广东一中学回应

2 月前

华商网 · 户太八号高端斓迦红葡萄酒 2瓶礼盒装188包邮

1 月前