专栏名称: 逛逛GitHub
每天推荐一个好玩的 GitHub 开源项目。
今天看啥  ›  专栏  ›  逛逛GitHub

这个开源的多模态模型无敌。。。

逛逛GitHub  · 公众号  ·  · 2024-05-23 13:45
    

文章预览

InternVL 由 OpenGVLab 开发,是一个开源的多模态对话模型, 其性能接近商业化的 GPT-4V 模型。 GPT-4V 是 OpenAI 去年推出的多模态模型,使用它你可以分析所需的任何类型的图像并获取有关该图像的信息。 1. InternVL 开源模型 而今天的主角研究成果 InternVL  发布在 CVPR 2024 上,并提供了多种模型版本以适应不同的应用场景,如 InternVL−Chat−V1.5 支持 4K 图像和强大的光学字符识别(OCR)功能。 开源地址:http s: //github. com /OpenGVLab/InternVL 2. 支持特性 InternVL 家族通过提供多种模型版本,支持从图像分类到多模态对话的多种功能。 以下是一些关键特性: 多语言支持: InternV L 能够支持超过 110 种语言的生成。 高性能: 在多个基准测试中,InternVL-Chat-V1.5 接近 GPT-4V 和 Gemini Pro 的性能。 多种模型选择: 提供了不同参数规模的模型,从 6B 到 19B 不等,以适应不同的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览