今天看啥  ›  专栏  ›  包包算法笔记

重磅!Llama3.1的405B权重和评测提前泄漏

包包算法笔记  · 公众号  ·  · 2024-07-23 10:00

文章预览

LLama3 405B的风声已久,此前有小道消息提到: 「Meta Platforms计划在7月23日发布其开源的Llama 3模型的最大版本,据一位Meta员工透露。这个版本拥有4050亿个参数,这些参数或"设置"决定了LLama3-405B大模型如何回答问题。此外,这个版本将是多模态的,能够理解并生成图像和文本。」 信息源:https://www.theinformation.com/briefings/meta-platforms-to-release-largest-llama-3-model-on-july-23 但最近网友已经发布了泄漏版的LLama3-405B的评测效果图。 目前,405B在官网页面显示的仍在训练中,并没有更新。往往小道消息传的是特别准的,昨天已经有媒体报道过3.1的权重页面,但是当时参数还没有下载地址。 比如: 并且这个页面已经404了,越来越像真的了。 但在7.22日晚间,权重就已经被神秘大佬泄漏出来了。 几个消息源和下载渠道如下: LLaMA 3.1 405B base model available for download Resources ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览