专栏名称: 上海证券报
《上海证券报》1991年7月1日伴随着新中国证券市场的建立而创刊,是我国第一张提供权威金融证券专业资讯的全国性财经日报。《上海证券报》是新华社重点报刊,中国证监会、保监会、银监会指定信息披露报纸。
今天看啥  ›  专栏  ›  上海证券报

DeepSeek,启动“开源周”

上海证券报  · 公众号  · 证券  · 2025-02-24 17:19
    

文章预览

2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。 DeepSeek称,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。“在H800上能实现3000 GB/s的内存带宽以及580 TFLOPS的计算性能。”DeepSeek表示。 据介绍,MLA(多层注意力机制)是一种改进的注意力机制,旨在提高Transformer模型在处理长序列时的效率和性能‌。MLA通过多个头(head)的并行计算,让模型能够同时关注文本中不同位置和不同语义层面的信息,从而更全面、更深入地捕捉长距离依赖关系和复杂语义结构‌。 DeepSeek介绍称,FlashMLA受到FlashAttention2 & 3和CUTLASS项目的启发。其中,FlashAttention能实现快速且内存高效的精确注意力;CUTLASS是由英伟达开发和维护的开源项目。 2月21日,DeepSeek在社交平台发文称,构建了一支探索AGI(通用人工智能 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览