实锤！斯坦福团队被曝抄袭清华系大模型，已删库！

集智书童 · 公众号 · · 2024-06-05 14:13

文章预览

点击卡片，关注我们近日，美国斯坦福大学的一个 AI 研究团队发布了名为 Llama3V 的 SOTA 开源多模态模型。然而，该模型在模型架构与代码上与清华系 AI 公司面壁智能于 5 月中旬发布的 8B 多模态小模型 MiniCPM-Llama3-V 2.5 完全相同，引发了舆论的广泛关注。 Llama3V 团队声称其模型效果比肩 GPT-4V、Gemini Ultra、Claude Opus，尺寸比 GPT4-V 小 100 倍，且训练成本仅需 500 美元。然而，Llama3V 很快受到了质疑，被指套用了 MiniCPM-Llama3-V 2.5 的 tokenizer（分词器）。Llama3V 团队辩称，他们在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。面壁智能团队通过测试发现，Llama3-V 大模型能识别清华简（清华大学收藏的一批战国竹简的简称），其训练数据的采集和标注均由清华 NLP 实验室和面壁智能团队完成，相关数据尚未对外公开。Llama3-V 在识别清华简的文字时，结果和 MiniCPM-Llam ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博