国产多模态卷上下文长度：原生支持24K图文输入输出，图像视频理解对标GPT4V

量子位 · 公众号 · AI · 2024-07-31 14:59

文章预览

陈林投稿自凹非寺量子位 | 公众号 QbitAI 国产多模态大模型，也开始卷上下文长度。书生·浦语灵笔（InternLM-XComposer）多模态大模型升级2.5版本—— 原生支持24K多模态图文上下文，超过20轮的图文交互，具备图像视频理解、网页创作、图文写作等多项功能。该开源模型一出，一度在Hugging Face登上热榜第五。作为8B量级性能最优秀的多模态大模型之一，它在多项评测性能上对标GPT4V和Gemini Pro。而除了支持长上下文输入，InternLM-XComposer 2.5版本（以下简称IXC 2.5）同时训练了长序列输出能力，模型支持高质量网页创作和文章生成。兼容三种多模态理解能力 IXC 2.5同时兼顾了多模态模型的理解和内容输出能力，主要包括三种多模态理解能力。包括超过4K分辨率的图像理解、多轮多图超长对话、精细视频内容分析。来具体看看大模型实力如何。高分辨率 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新智元 · 谷歌Fellow级大佬出走！17年老将吴永辉加盟字节，亲自操刀大模型研发

昨天

爱可可-爱生活 · LServe 创新性地提出了混合稀疏注意力机制，通过统一块稀疏框-20250222055225

昨天

爱可可-爱生活 · 【[339星]macai：macOS上的全能AI聊天神器，一站式-20250221215157

2 天前

爱可可-爱生活 · 【[445星]EvalScope：一站式大模型评估与性能基准测试-20250221141932

2 天前

人工智能那点事 · “80后已死5.2%”？这么离谱的假消息! AI的锅？

2 天前

南都鉴定评测实验室 · 抗菌纺织品测评：蕉内男袜纤维含量虚标，竹之锦毛巾抑菌率不达标

9 月前

中国科学家 · 38年专啃“硬骨头”！他是缺什么就造什么的“科苑名匠”

1 年前

起点财经 · 我好像发现不得了的秘密，难怪它家的跑鞋这么好穿...

8 月前