文章预览
点击卡片,关注我们 近日,美国斯坦福大学的一个 AI 研究团队发布了名为 Llama3V 的 SOTA 开源多模态模型。然而,该模型在模型架构与代码上与清华系 AI 公司面壁智能于 5 月中旬发布的 8B 多模态小模型 MiniCPM-Llama3-V 2.5 完全相同,引发了舆论的广泛关注。 Llama3V 团队声称其模型效果比肩 GPT-4V、Gemini Ultra、Claude Opus,尺寸比 GPT4-V 小 100 倍,且训练成本仅需 500 美元。然而,Llama3V 很快受到了质疑,被指套用了 MiniCPM-Llama3-V 2.5 的 tokenizer(分词器)。Llama3V 团队辩称,他们在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。 面壁智能团队通过测试发现,Llama3-V 大模型能识别清华简(清华大学收藏的一批战国竹简的简称),其训练数据的采集和标注均由清华 NLP 实验室和面壁智能团队完成,相关数据尚未对外公开。Llama3-V 在识别清华简的文字时,结果和 MiniCPM-Llam
………………………………