文章预览
Datawhale分享 最新:李沐,来源:量子位 AI大神李沐老师 时隔1年多 ,终于回归B站“填坑” 经典论文精读系列 了! 没错,最新主角儿还是Llama-3.1: 在这个18分钟左右的视频中,李沐老师 手把手 教我们读Llama-3.1技术论文,甚至还爆料了一些 八卦 。 (指路7分50秒左右) 他提到,Llama团队在训练最大模型时,其实一开始 同时训练 了MoE模型和稠密模型,但是前者后来失败了,所以最后只发了一个简单版本。 更多细节大家可以去看原视频,悄咪咪透露,李沐老师刚一上线,播放瞬间 破万 了。 一大批研究僧们正闻风赶来,瞧瞧热一就知道大家的精神状态了: ( 视频地址领取 ) 李沐Llama3.1论文精读 https://www.bilibili.com/video/BV1WM4m1y7Uh/ Datawhale Llama3.1 部署及微调教程(配合李沐论文精读) https://github.com/datawhalechina/self-llm/tree/master/models/Llama3_1
………………………………