专栏名称: 深度学习与NLP
专注深度学习、NLP相关技术、资讯,追求纯粹的技术,享受学习、分享的快乐。
目录
相关文章推荐
Java基基  ·  SpringBoot ... ·  昨天  
科技日报  ·  惊喜!歼-20S来了 ·  4 天前  
今天看啥  ›  专栏  ›  深度学习与NLP

失联大神李沐B站复更:领读Llama 3.1论文,还多讲了一点AI八卦;大模型竞技场Llama 3.1排名第三

深度学习与NLP  · 公众号  ·  · 2024-08-01 20:18

文章预览

来源 | 量子位  ID | QbitAI AI大神李沐老师 时隔1年多 ,终于回归B站“填坑” 经典论文精读系列 了! 没错,最新主角儿还是Llama-3.1: 在这个18分钟左右的视频中,李沐老师 手把手 教我们读Llama-3.1技术论文,甚至还爆料了一些 八卦 。 (指路7分50秒左右) 他提到,Llama团队在训练最大模型时,其实一开始 同时训练 了MoE模型和稠密模型,但是前者后来失败了,所以最后只发了一个简单版本。 更多细节大家可以去看原视频,悄咪咪透露,李沐老师刚一上线,播放瞬间 破万 了。 一大批研究僧们正闻风赶来,瞧瞧热一就知道大家的精神状态了: (视频地址在文末领取) 与此同时,大模型竞技场排名更新, Llama-3.1-405B 代表开源模型 首次跻身 竞技场前三,仅次于GPT-4o和Claude-3.5-Sonnet。 当然了,这一结果可能并不意外,Meta官方早就暗戳戳地将这几个作了 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览