今天看啥  ›  专栏  ›  金融科技研究

DeepSeek发布最新技术论文,梁文锋参与署名

金融科技研究  · 公众号  ·  · 2025-02-19 13:57
    

文章预览

导读: 日前, DeepSeek在社交平台X上发布了一篇关于NSA的纯技术论文报告。 值得一提的是,在这篇名为《原生稀疏注意力:硬件对齐且可原生训练的稀疏注意力机制》 (Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention) 的 论文署名中,DeepSeek创始人兼CEO梁文锋也作为共创在列。 DeepSeek突传大动作。 2月18日,DeepSeek在社交平台X上发布了一篇关于NSA的纯技术论文报告。 DeepSeek称, NSA是一种与硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理。通过针对现代硬件的优化设计,NSA加快了推理速度,同时降低了预训练成本,而不会影响性能。 与此同时, 人工智能初创公司月之暗面 也有大动作。2月18日, 其宣布推出一款新模型Kimi Latest, 它将对标Kimi智能助手当前使用的模型,随智能助手产品更新而同步升级(模 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览