今天看啥  ›  专栏  ›  机器之心SOTA模型

今日开源(2025-03-18):昆仑万维发布Skywork-R1V,38B多模态推理模型,视觉链式...

机器之心SOTA模型  · 公众号  ·  · 2025-03-18 18:17
    

文章预览

🏆基座模型 ①项目:Skywork-R1V ★Skywork-R1V是首个开源的多模态推理模型,具备先进的视觉链式思维能力。 该模型能够在视觉输入上进行多步骤的逻辑推理,将复杂的图像问题分解为可管理的步骤。此外,它还能够解决视觉数学问题,并高精度地解释科学和医学图像。 Skywork-R1V无缝集成文本和图像,实现更丰富的上下文感知理解。 ☆一键收藏: https://sota.jiqizhixin.com/project/skywork-r1v ②项目:SmolDocling ★SmolDocling-256M-preview 是一个多模态的图像-文本到文本模型,专为高效的文档转换而设计。 它保留了 Docling 的大部分流行功能,并通过无缝支持 DoclingDocuments 确保与 Docling 的完全兼容。该模型能够从图像中准确提取文本,保留文档结构和元素边界框,识别和格式化代码块,处理数学表达式,提取和解释图表数据, 支持结构化表格提取,并区分图形元素 。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览