多模态推理相关工作速览

机器学习算法与自然语言处理 · 公众号 · · 2025-04-01 09:00

文章预览

MLNLP 社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。社区的愿景是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进步，特别是初学者同学们的进步。来源 |RUC AI Box 作者｜顾俞凯@ 中国人民大学研究方向｜多模态模型思维链 (Chain-of-Thought, CoT) 已被广泛认为是提升大型语言模型 (LLM) 推理能力的关键技术。受 Deepseek R1 等模型成功的启发，研究者们正积极探索如何将类似的推理强化方法应用于多模态大模型（MLLM）。本文旨在梳理近期多模态模型推理的相关研究进展，以期为未来研究提供参考。 1.Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models https://arxiv.org/pdf/2501.12948 简介： DeepSeek-R1-Zero已成功证明了LLM仅通过强化学习（RL）就能涌现推理能力 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博