专栏名称: 阿里云
阿里云计算
今天看啥  ›  专栏  ›  阿里云

通义千问Qwen2-VL开源,API可直接调用!

阿里云  · 公众号  ·  · 2024-09-02 14:10

文章预览

通义千问宣布开源第二代视觉语言模型Qwen2-VL,并推出2B、7B两个尺寸及其量化版本模型。同时,旗舰模型Qwen2-VL-72B的API已上线阿里云百炼平台,用户可直接调用。 #  性能全面提升 相比上代模型,Qwen2-VL的基础性能全面提升,交出了一份新的成绩单: 读懂不同分辨率和不同长宽比的图片, 在DocVQA、RealWorldQA、MTVQA 等基准测试创下全球领先的表现; 理解20分钟以上长视频, 支持基于视频的问答、对话和内容创作等应用; 具备 强大的视觉智能体能力 ,可自主操作手机和机器人,借助复杂推理和决策的能力,Qwen2-VL 可以集成到手机、机器人等设备,根据视觉环境和文字指令进行自动操作; 理解图像视频中的多语言文本 ,包括中文、英文,大多数欧洲语言,日语、韩语、阿拉伯语、越南语等。 通义千问团队从六个方面评估了模型能力,包括综合的大学 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览