今天看啥  ›  专栏  ›  道明数字游牧生活

Llama-3.1?405B参数?开源却是最好的模型?

道明数字游牧生活  · 公众号  ·  · 2024-07-23 12:58

文章预览

看起来,各种信息都指向了24小时内,Meta就会发布LlaMA-3的405B参数规模的模型。证据主要是两点:一是在Goole的索引里出现了模型文件的下载页面,虽然内容还是为空;二是在Azure云的模型评估项目里,出现了新模型的评分。 几小时前,社交媒体上还出现了模型文件的磁力链接,完整的模型文件约800GB。 如果上述的“信息泄漏”都是真实的(看起来绝大部分可靠),确实会让许多人兴奋。 1、Meta会发布LlaMA-3.1,所以不仅仅是405B,也会有新的70B和8B。405B模型在绝大多数评分上超越了GPT-4o(人类评价上依然不如GPT-4o),如果Meta确实把这个模型都开源(仅开放权重)了,那么模型的格局真的大变了; 2、LlaMA-3.1的70B和8B模型相比LlaMA-3也有了长足的进步,尤其是数学和代码生成方面;405B模型毕竟太大了,对硬件的要求其实非常高,所以更好的数学和代码生 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览