今天看啥  ›  专栏  ›  LLM SPACE

大模型日报(5月20日 资讯篇)

LLM SPACE  · 公众号  ·  · 2024-05-20 20:22
    

文章预览

特别活动 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢 迎 大 家 一 起 交 流 ! 资讯 0 1 Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star 一个月前,Meta 发布了开源大模型 llama3 系列,在多个关键基准测试中优于业界 SOTA模型,并在代码生成任务上全面领先。此后,开发者们便开始了本地部署和实现,比如 llama3 的中文实现、llama3 的纯 NumPy 实现等。十几个小时前,有位名为「Nishant Aklecha」的开发者发布了一个从零开始实现 llama3 的存储库,包括跨多个头的注意力矩阵乘法、位置编码和每个层在内都有非常详细的解释。该项目得到了大神 Karpathy 的称赞,他表示项目看起来不错,完全展开后,通过模块嵌套和相互调用,可以更 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览