专栏名称: FightingCV
一个专注于分享计算机视觉、多模态机器学习方向前沿论文,解答常见科研问题,分享好用科研工具的公众号。努力努力再努力,瑞思拜!
目录
相关文章推荐
今天看啥  ›  专栏  ›  FightingCV

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

FightingCV  · 公众号  ·  · 2024-07-21 15:40

文章预览

关注“ FightingCV ”公众号 回复“ AI ”即可获得超100G人工智能的 教程 点击进入→   FightingCV交流群 小模型的战场,打起来了! 继GPT-4o mini、Mistral NeMo发布之后,苹果也入局了。 DCLM小模型包含两种参数规模——70亿和14亿,发布即开源。最大70亿参数超越了Mistral-7B ,性能接近Llama 3、Gemma。 根据苹果ML小组研究科学家Vaishaal Shankar(也是DCLM研发人员)的说法,这是迄今为止性能最好的「真正开源」的模型,不仅有权重和训练代码,而且是基于开放数据集DCLM-Baseline。 相比模型性能,DCLM做出的「真正开源」的典范更加引人关注。 对比大部分科技巨头只搞闭源模型,或「犹抱琵琶半遮面」, 只开源代码或权重的做法,大方的苹果获得了网友的好评 。 此外,Shankar还预告说,之后会继续上线模型中间检查点和优化器状态。 难道,这就是LLM开源社区的春天 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览