专栏名称: 凡人机器学习
了解机器学习在业务中的应用,让更多的初级数据开发者可以享受到人工智能的福利。
今天看啥  ›  专栏  ›  凡人机器学习

LLama3 405B模型使用体验以及基本优化原理(RS、SFT、DPO)

凡人机器学习  · 公众号  ·  · 2024-07-24 14:57

文章预览

今天Meta发布了迄今为止最大的开源大模型LLama3 405B,目前看在各项榜单中,该模型的表现可以说无限趋近于长期霸榜的两个闭源模型GPT-4O以及Claude3.5。 从Meta自己放出的评估结果可以看出,他将模型的评价分为通用能力(以MMLU为主)和专业能力,在专业能力中主要针对Reasoning、Code、Math、Tool Use、Multilingual等方面,对应到业务应用,这些能力正好对应到数字工程师、Agent 、数字教育、数字营销等场景。 体验情况 目前很多平台,特别是国内的公司都在加班加点做该模型的支持,180GB左右的模型,超过了任何单卡显存,需要分布式推理的能力才能跑起来。我第一时间在Hugging face spaces上找到了可以试用的方案,跑了一道初中的物理题,测试Reasoning能力,效果还是不错的。(这里有一个Trick是虽然官方文档说LLama3不支持中文,但是实际用的话中文是没有太 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览