专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
今天看啥  ›  专栏  ›  机器之心

多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代

机器之心  · 公众号  · AI  · 2025-03-18 15:35
    

文章预览

机器之心报道 编辑:杜伟、泽南 DeepSeek-R1 问世后,我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。如果能在视觉等各领域复刻强化学习(RL)在文本上的突破,AI 应用势必会将更多领域推入新的范式。 毫无疑问,这也是众多科技公司正在探索的方向。 3 月 18 号,昆仑万维正式发布 Skywork R1V(以下简称 R1V)系列模型,实现了 SOTA 级别的视觉推理和强大的通用推理能力。随着新模型的到来,昆仑万维成为了 国内第一家开源多模态思维链推理模型的企业 。 目前,昆仑万维已经开源了 R1V 的模型权重和技术报告。 Hugging Face 地址:https://huggingface.co/Skywork/Skywork-R1V-38B Github 地址:https://github.com/SkyworkAI/Skywork-R1V 技术报告地址:https://github.com/SkyworkAI/Skywork-R1V/blob/main/Skywork_R1V.pdf 具体表现如何呢?从多项基准测试来看,R1V-38B 相比较文本推 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览