专栏名称: APPSO
让智能手机更好用的秘密。
目录
相关文章推荐
APPSO  ·  OpenAI ... ·  4 天前  
小众软件  ·  另外两件事[2492] ·  5 天前  
今天看啥  ›  专栏  ›  APPSO

首个超越 GPT-4o 的开源模型提前泄露!Hugging Face 紧急 404 | 附下载链接

APPSO  · 公众号  · app  · 2024-07-23 13:47

主要观点总结

本文主要介绍了Meta的开源大模型Llama 3.1的发布情况及其与GPT-4o的对比。Llama 3.1在多项基准测试中得分超越GPT-4o,展现出强大的性能。文章还提到了Llama 3.1支持多种语言、模型参数、预训练数据等情况。同时,文章也提到了其他小模型的进步和AI领域的内卷态势。

关键观点总结

关键观点1: Llama 3.1发布在即,基准测试成绩亮眼,超越GPT-4o。

新模型Llama 3.1的基准测试结果显示,它在多项测试中的得分超过了GPT-4o,甚至70B版本也能与GPT-4o互有胜负。

关键观点2: Llama 3.1支持多种语言,拥有多种版本。

Llama 3.1是一个经过预训练和指令微调的多语言大模型,拥有8B、70B、405B等不同版本,支持英语、德语、法语等多种语言。

关键观点3: Llama 3.1的预训练数据和自定义训练库。

Llama 3.1使用了来自公开来源的约15万亿个token数据进行了预训练,预训练数据的截止日期为2023年12月。此外,它还使用了Meta定制的GPU集群和自定义训练库。

关键观点4: Llama 3.1面临竞争和期待。

随着Llama 3.1的发布,人们期待它能否上演开源逆袭最强闭源大模型的史诗级奇迹。同时,AI领域的小模型也呈现出扎堆内卷的态势,更多具体的信息仍有待官方正式版本的发布。


文章预览

坐拥最强大模型宝座两个月后,GPT-4o 的霸主级地位也不稳了。 在 5 月份的春季发布会上,OpenAI 发布了多模态大模型 GPT-4o ,再次夺回了最强大模型的宝座,当时业界的目光也投向了 Meta 的 Llama 3-405B,期待这款开源大模型能够撼动 GPT-4o 的统治地位。 前不久,外媒 The Information 放出消息称,Meta Llama 3 405B 将于当地时间 7 月 23 日正式发布, 但没想到赶在发布的前一天,新模型 Llama 3.1 的关键「情报」已经不胫而走。 从 Llama 3.1 泄露的基准测试结果来看,Llama 3.1-405B 在 boolq、gsm8k、hellaswag 等多项基准测试得分均超越了 GPT-4o,甚至 70B 版本也能与 GPT-4o 互有胜负。 根据附带的说明,这还只是 base(基础)模型的评测结果,经过进一步指令微调,性能还有望提升。也就是说,如果泄露的数据靠谱,那么 Llama 3.1 或将上演一场开源逆袭最强闭源大模型的史诗级 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览