专栏名称: 天天基金网

天天基金是东方财富信息股份有限公司旗下全资子公司，是中国证监会批准的首批独立基金销售机构。天天基金凭借其专业、及时、全面的财经平台优势，为广大投资者提供一站式金融理财服务。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

不可错过！DeepSeek开源周重磅开启！

天天基金网 · 公众号 · · 2025-02-25 11:36

文章预览

2月24日，DeepSeek启动“开源周”，开源了首个代码库FlashMLA。 DeepSeek称，这是DeepSeek针对Hopper GPU优化的高效MLA解码内核，专为处理可变长度序列而设计，现在已经投入生产使用。“在H800上能实现3000 GB/s的内存带宽以及580 TFLOPS的计算性能。”DeepSeek表示。据介绍，MLA（多层注意力机制）是一种改进的注意力机制，旨在提高Transformer模型在处理长序列时的效率和性能‌。MLA通过多个头（head）的并行计算，让模型能够同时关注文本中不同位置和不同语义层面的信息，从而更全面、更深入地捕捉长距离依赖关系和复杂语义结构‌。 DeepSeek介绍称，FlashMLA受到FlashAttention2 & 3和CUTLASS项目的启发。其中，FlashAttention能实现快速且内存高效的精确注意力；CUTLASS是由英伟达开发和维护的开源项目。 2月21日，DeepSeek在社交平台发文称，构建了一支探索AGI（通用人工智能 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博