机构投资者组成的社区,深度点评财经事件
今天看啥  ›  专栏  ›  Dots机构投资者社区

从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题

Dots机构投资者社区  · 公众号  ·  · 2025-02-16 08:15
    

文章预览

本文转自微信公众号“机器之心”,作者:机器之心。 本文将介绍首个关于长推理模型 “思考不足” 现象的工作。该工作由腾讯 AI Lab 与苏州大学、上海交通大学团队共同完成。本文的通讯作者为涂兆鹏,腾讯专家研究员,研究方向为深度学习和大模型,在国际顶级期刊和会议上发表学术论文一百余篇,引用超过 9000 次。担任 SCI 期刊 NeuroComputing 副主编,多次担任 ACL、EMNLP、ICLR 等国际顶级会议领域主席。第一作者为苏州大学博士生王越,腾讯 AI Lab 高级研究员刘秋志、徐嘉豪、梁添,以及上海交通大学博士生陈星宇、何志威。 论文题目:Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs 论文地址:https://arxiv.org/pdf/2501.18585 背景与动机 长推理模型(Long Reasoning Models),如 OpenAI o1 [1]、QwQ-32B-Preview [2]、 DeepSeek-R1-671B [3] 和 Kimi K1.5 [4] 等,因其展现 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览