文章预览
回顾上周五,DeepSeek 官方账号就在 X 平台上表示从本周开始: DeepSeek 将陆续公布 5 个开源项目, 通过这种透明且真诚的方式,向全球公布分享团队在探索 AGI 道路上的进展。 将其定义为 OpenSourceWeek! 01 开源第一弹 今天早上 9 点,DeepSeek 在 X 平台上公布 OpenSourceWeek 开源第一弹: FlashMLA。 这个帖子底下最受欢迎的评论是:“我听说第五天将是 AGI ” 02 FlashMLA 项目简介 FlashMLA 发布 3 个小时就已经 3.6k 的 Star 了(我写这篇文字的时候,Star 量在不停的变),而且还在持续暴涨中。 开源地址:http s: //github. com /deepseek-ai/FlashMLA 这个开源项目的贡献偏技术一些,核心描述是: “FlashMLA is an efficient MLA decoding kernel for Hopper GPUs, optimized for variable-length sequences serving.” 重要关键词多层级注意力机制(Multi-Layer Attention, MLA) 是 DeepSeek 大模型的重要技术创新点。
………………………………