专栏名称: AI算法与图像处理
考研逆袭985,非科班跨行AI,目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技,共同分享宝贵的资源资料,这里有机器学习,计算机视觉,Python等技术实战分享,也有考研,转行IT经验交流心得
今天看啥  ›  专栏  ›  AI算法与图像处理

国产多模态大模型!支持24K图文输入输出,图像视频理解对标GPT4V

AI算法与图像处理  · 公众号  ·  · 2024-07-31 22:29

文章预览

来源:量子位 | 公众号 QbitAI 国产多模态大模型,也开始卷上下文长度。 书生·浦语灵笔(InternLM-XComposer)多模态大模型升级2.5版本—— 原生支持24K多模态图文上下文,超过20轮的图文交互,具备图像视频理解、网页创作、图文写作等多项功能。 该开源模型一出,一度在Hugging Face登上热榜第五。 作为8B量级性能最优秀的多模态大模型之一,它在多项评测性能上对标GPT4V和Gemini Pro。 而除了支持长上下文输入,InternLM-XComposer 2.5版本 (以下简称IXC 2.5) 同时训练了长序列输出能力,模型支持高质量网页创作和文章生成。 兼容三种多模态理解能力 IXC 2.5同时兼顾了多模态模型的理解和内容输出能力,主要包括三种多模态理解能力。 包括超过4K分辨率的图像理解、多轮多图超长对话、精细视频内容分析。 来具体看看大模型实力如何。 高分辨率图像理解 , ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览