专栏名称: 晚点LatePost
互联网科技博主
今天看啥  ›  专栏  ›  晚点LatePost

【#阿里开源视觉推理模型#】模型名为 QVQ,可以根据图像和指令-20241226225202

晚点LatePost  · 微博  ·  · 2024-12-26 22:52
    

文章预览

2024-12-26 22:52 本条微博链接 【 #阿里开源视觉推理模型# 】模型名为 QVQ,可以根据图像和指令开始思考,是当前大模型最新的研究方向之一,也是大公司开源的第一款视觉推理模型。11 月,阿里开源了类似 o1 的语言模型 QwQ。 阿里介绍,QVQ 在多学科多模态测试基准数据集 MMMU 上得分为 70.3,超过 GPT-4o,接近 Claude 3.5 Sonnet,比 o1 模型差一些。中国公司在大模型开源社区存在感今年明显变强,当前大模型竞技场 Chatbot Arena 上 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览