多模态也做到了强推理！工业界首个开源的R1V，让视觉思考进入o1时代

机器之心 · 公众号 · AI · 2025-03-18 15:35

文章预览

机器之心报道编辑：杜伟、泽南 DeepSeek-R1 问世后，我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。如果能在视觉等各领域复刻强化学习（RL）在文本上的突破，AI 应用势必会将更多领域推入新的范式。毫无疑问，这也是众多科技公司正在探索的方向。 3 月 18 号，昆仑万维正式发布 Skywork R1V（以下简称 R1V）系列模型，实现了 SOTA 级别的视觉推理和强大的通用推理能力。随着新模型的到来，昆仑万维成为了国内第一家开源多模态思维链推理模型的企业。目前，昆仑万维已经开源了 R1V 的模型权重和技术报告。 Hugging Face 地址：https://huggingface.co/Skywork/Skywork-R1V-38B Github 地址：https://github.com/SkyworkAI/Skywork-R1V 技术报告地址：https://github.com/SkyworkAI/Skywork-R1V/blob/main/Skywork_R1V.pdf 具体表现如何呢？从多项基准测试来看，R1V-38B 相比较文本推 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博