文章预览
这两天上海 AI lab 开源了一个非常强的多模态 LLM 浦语·灵笔2.5 - InternLM-XComposer-2.5 。国内现况是几家大厂到现在也没有个好用的多模态 LLM,现在上海 AI lab 竟然直接就开源了 技术报告: https://arxiv.org/abs/2407.03320 体验地址: https://huggingface.co/spaces/Willow123/InternLM-XComposer github: https://github.com/InternLM/InternLM-XComposer 浦语·灵笔2.5是基于书生·浦语2大语言模型研发的突破性的图文多模态大模型,仅使用 7B LLM 后端就达到了 GPT-4V 级别的能力。浦语·灵笔2.5使用24K交错的图像-文本上下文进行训练,通过RoPE外推可以无缝扩展到96K长的上下文。这种长上下文能力使浦语·灵笔2.5在需要广泛输入和输出上下文的任务中表现出色 超高分辨率理解:浦语·灵笔2.5使用560×560分辨率的ViT视觉编码器增强了IXC2-4KHD中提出的动态分辨率解决方案,支持具有任意纵横比的高分辨
………………………………