首个超越 GPT-4o 的开源模型提前泄露！Hugging Face 紧急 404 | 附下载链接

APPSO · 公众号 · app · 2024-07-23 13:47

主要观点总结

本文主要介绍了Meta的开源大模型Llama 3.1的发布情况及其与GPT-4o的对比。Llama 3.1在多项基准测试中得分超越GPT-4o，展现出强大的性能。文章还提到了Llama 3.1支持多种语言、模型参数、预训练数据等情况。同时，文章也提到了其他小模型的进步和AI领域的内卷态势。

关键观点总结

关键观点1: Llama 3.1发布在即，基准测试成绩亮眼，超越GPT-4o。

新模型Llama 3.1的基准测试结果显示，它在多项测试中的得分超过了GPT-4o，甚至70B版本也能与GPT-4o互有胜负。

关键观点2: Llama 3.1支持多种语言，拥有多种版本。

Llama 3.1是一个经过预训练和指令微调的多语言大模型，拥有8B、70B、405B等不同版本，支持英语、德语、法语等多种语言。

关键观点3: Llama 3.1的预训练数据和自定义训练库。

Llama 3.1使用了来自公开来源的约15万亿个token数据进行了预训练，预训练数据的截止日期为2023年12月。此外，它还使用了Meta定制的GPU集群和自定义训练库。

关键观点4: Llama 3.1面临竞争和期待。

随着Llama 3.1的发布，人们期待它能否上演开源逆袭最强闭源大模型的史诗级奇迹。同时，AI领域的小模型也呈现出扎堆内卷的态势，更多具体的信息仍有待官方正式版本的发布。

文章预览

坐拥最强大模型宝座两个月后，GPT-4o 的霸主级地位也不稳了。在 5 月份的春季发布会上，OpenAI 发布了多模态大模型 GPT-4o ，再次夺回了最强大模型的宝座，当时业界的目光也投向了 Meta 的 Llama 3-405B，期待这款开源大模型能够撼动 GPT-4o 的统治地位。前不久，外媒 The Information 放出消息称，Meta Llama 3 405B 将于当地时间 7 月 23 日正式发布，但没想到赶在发布的前一天，新模型 Llama 3.1 的关键「情报」已经不胫而走。从 Llama 3.1 泄露的基准测试结果来看，Llama 3.1-405B 在 boolq、gsm8k、hellaswag 等多项基准测试得分均超越了 GPT-4o，甚至 70B 版本也能与 GPT-4o 互有胜负。根据附带的说明，这还只是 base（基础）模型的评测结果，经过进一步指令微调，性能还有望提升。也就是说，如果泄露的数据靠谱，那么 Llama 3.1 或将上演一场开源逆袭最强闭源大模型的史诗级 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博