Mistral新旗舰决战Llama 3.1！最强开源Large 2 123B，扛鼎多语言编程全能王

机器学习研究组订阅 · 公众号 · AI · 2024-07-25 20:35

文章预览

昨天正式发布的Llama 3.1模型，让AI社区着实为之兴奋。但是仔细一想就能发现——405B的参数规模，基本是没法让个人开发者在本地运行了。比如昨天刚发布，就有一位勇敢的推特网友亲测，用一张英伟达4090运行Llama 3.1。结果可想而知，等了30分钟模型才开始回应，缓缓吐出一个「The」。最后结果是，Llama给出完整回应，整整用了20个小时。根据Artificial Analysis的估算，你需要部署含2张8×H100的DGX超算才能在本地运行405B。看来，小扎对Llama 3.1成为开源AI界Linux的期待，可能和现实有不少的差距。目前的硬件能力，很难支持405B模型的大范围全量运行。此时，又一位开源巨头Mistral精准踩点，发布了他们的最新旗舰模型Mistral Large 2。 Mistral Large 2在代码生成、数学和推理等方面的能力明显增强，可以与GPT-4o和Llama 3.1一较高下。而且，模型参数量仅有123B， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · AI Agent正在悄然掀起一场企业数字化转型的新浪潮。让我们一-20250103061227

昨天

爱可可-爱生活 · 在OpenAI最新放出的重磅消息中，o1模型展现出令人惊艳的数理-20250102221511

昨天

黄建同学 · 新年快乐🎉//@刘群MT-to-Death:妙啊！2025=1-20250101102704

3 天前

宝玉xp · 转发微博-20250101093750

3 天前

爱可可-爱生活 · 本文提出了PRISM方法，通过使用结构化记忆和程序化修订，有效地-20241231053815

4 天前

新财富 · 股票组前10名平均收益率高达22.7%，新财富投顾评选5月数据揭晓！公募基金配置组建仓倒计时！

7 月前

王叔日志 · 经济不好，在家做点小项目

6 月前