超越GPT-4o！阿里发布最强开源多模态模型Qwen2-VL，支持实时视频对话

智见AGI · 公众号 · · 2024-08-30 17:50

文章预览

来源 | 量子位新的最强开源多模态大模型来了！阿里Qwen2大模型家族新添多模态模型 Qwen2-VL ，在图像和长视频理解任务上双双取得了SOTA。在具体的子类任务中，Qwen2-VL在大部分的指标上都达到了最优，甚至超过 GPT-4o等闭源模型。在多模态能力的加持下，Qwen2-VL可以实时读取摄像头或电脑屏幕，进行文字形式的视频对话。甚至还能作为Agent与环境进行交互，根据任务目标自主操控手机等设备。此次发布的Qwen2共有2B、7B、72B三个版本，其中2B和7B版本已可下载并免费商用（Apache 2.0），72B则通过API提供。目前开源代码已集成到Hugging Face Transformers、vLLM等第三方框架中。还有不少网友都在狂cue一些知名大模型推理平台，如Groq、Ollama，希望能够早日 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

陈梦竹海外研究之声 · 国海海外·陈梦竹 | 拼多多（PDD.O）2024Q3财报点评：营收及利润增长放缓，坚持长期高质量投入

5 小时前

陈梦竹海外研究之声 · 国海海外·陈梦竹 | 拼多多（PDD.O）2024Q3财报点评：营收及利润增长放缓，坚持长期高质量投入

5 小时前

淘宝教育商家成长 · 400万商家都在用的AI生意管家，如何帮助商家降本增效？

3 天前

今日悉尼 · 杀疯了！$49.99就有可能买到大疆Pocket 3 creator combo?! 诈骗吗？

5 天前

TK增长会 · TikTok创业项目的选择，给我的教训最深

5 天前

浪潮新消费 · 从这届双11，看本地商家如何协同经营，打造“飞轮效应”？

6 天前

雪球 · 本文尝试从几个不同的角度来看一看哪些QDII美元债基金值得关注-20240822180951

3 月前

DT商业观察 · 小红书，食饮品牌的爆款制造机

2 周前