开源模型进展盘点：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？

机器之心 · 公众号 · AI · 2024-06-02 12:29

文章预览

机器之心报道编辑：Panda 深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察，也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中，他盘点分析了 4 月份发布的四个主要新模型：Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。他还通过一篇论文探讨了 DPO 和 PPO 的优劣之处。之后，他分享了 4 月份值得关注的一些研究成果。 Mixtral、Llama 3 和 Phi-3：有什么新东西？首先，从最重要的话题开始：4 月发布的主要新模型。这一节将简要介绍 Mixtral、Llama 3 和 Phi-3。下一节将会更详细地介绍苹果的 OpenELM。 Mixtral 8x22B：模型越大越好！ Mixtral 8x22B 是 Mistral AI 推出的最新款混合专家（MoE）模型，其发布时采用了宽松的 Apache 2.0 开源许可证。这个模型类似于 2024 年发布的 Mixtral 8x7B，其背后的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

黄建同学 · llama-4：最好的开源多模态大模型//@karminski--20250406100646

21 小时前

宝玉xp · 把照片变成 3D Q版风格工具：Sora.com 或 GPT-4-20250405002612

2 天前

AI前线 · 黄仁勋被实习生说服用 CUDA，但遭团队嫌弃？！英伟达早期架构师首次曝光：12 人团队如何开启“算力帝国”

2 天前

爱可可-爱生活 · #转发赠书#携手@博文视点Broadview 送出3本《自然语言-20250404074832

2 天前

黄建同学 · 其实可能是从deepseek开始，让老外知道了免费又强大的模型的-20250403165028

3 天前

上海松江 · 九亭镇2024年度经济高质量发展先进组织和先进个人名单出炉

1 月前