专栏名称: DataLearner
关注数据科学 关注科技行业 关注人工智能 关注一切促进人类生活美好的新技术
今天看啥  ›  专栏  ›  DataLearner

Meta开源Llama3.3-70B:大模型后训练佳作,400万美元训练成本,性能接近4050亿参数的Llama3.1-405B

DataLearner  · 公众号  ·  · 2024-12-08 22:37
    

文章预览

本文原文来自DataLearnerAI官方博客: https://www.datalearner.com/blog/1051733668227869 Llama系列大语言模型一直是开源领域的大模型标杆,Llama3系列大模型自从开源之后一直在不断更新。最早的Llama3模型于2024年4月开源,此后,几乎每个三个月都有一个新版本发布。就在昨天,Meta开源了最新的Llama3.3-70B模型,这是Llama3.3系列目前唯一开源的模型。尽管该模型的参数规模仅仅700亿,但是在多项评测基准上已经超过了4050亿参数规模的Llama3.1-405B,后者是Llama系列模型中参数规模最大的一个,也是业界开源模型中参数规模最高的模型之一。 Llama3.3-70B-Instruct简介 Llama3.3-70B-Instruct的评测结果 Llama3.3和其它Llama3系列模型的关系 Llama3.3-70B-Instruct的训练成本和开源情况 Llama3.3-70B-Instruct简介 Llama3.3-70B-Instruct是目前Llama3.3系列中唯一开源的模型,且没有基座大模型,仅开源了指令优 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览