今天看啥  ›  专栏  ›  深度学习与NLP

开源=最强大模型!Llama3.1发布,405B超越闭源GPT-4o,扎克伯格:分水岭时刻

深度学习与NLP  · 公众号  ·  · 2024-07-25 08:00

文章预览

来源 | 量子位 ID | QbitAI 刚刚, LIama 3.1 正式发布,登上大模型王座! 在150多个基准测试集中,405B版本的表现追平甚至超越了现有SOTA模型GPT-4o和Claude 3.5 Sonnet。 也就是说,这次, 最强开源模型即最强模型 。 在此之前,Llama 3.1已经被多番曝光泄露,如今可以说千呼万唤始出来。 从今天开始,模型即可在官网上下载使用,Meta AI应用可在线试玩。 更令研究社区赞赏的是发布近100页详细论文,涵盖了创造Llama 3.1过程中的一切:预训练数据、过滤、退火、合成数据、缩放定律、基础设施、并行性、训练配方、训练后适应、工具使用、基准测试、推理策略、量化、视觉、语音、视频…… HuggingFace首席科学家赞叹:如果你是从零开始研究大模型,就从这篇论文读起。 小扎 扎克伯格 还在最新接受彭博社采访时专门嘲讽了一把OpenAI。 奥特曼的领导能力值得称赞 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览