今天看啥  ›  专栏  ›  NLP工作站

Qwen3开源前菜,补全2.5VL系列模型空缺,开源32B模型

NLP工作站  · 公众号  ·  · 2025-03-25 03:03
    

文章预览

Qwen,汪峰属性是直接拉满了! 在Qwen3开源之前,Qwen先把之前的视觉理解多模态大模型补齐了,之前有3B、7B、72B三种尺寸,可能7B有点小,72B消耗资源有太多,32B真是个甜点尺寸。 HF link: https://huggingface.co/Qwen/Qwen2.5-VL-32B-Instruct 之前测试并介绍过Qwen2.5-VL的模型,见 Qwen2.5-VL系列模型正式开源,千问永远不会让你失望 | 附实测结果 。 32B这个模型,从指标上来看,没有比72B差很多,见图2-3。 由于晚更新于其他2.5VL模型,还通过强化学习进一步增强了数学和问题解决能力,回复风格更符合人类偏好。 最后,DeepSeek-V3也更新版本了,开源了v3-0324版本模型,依旧超大,Qwen明天热度是否可以超过,拭目以待~ NLP工作站 4群 成立啦! 欢迎入群交流! ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览