专栏名称: 上海证券报
《上海证券报》1991年7月1日伴随着新中国证券市场的建立而创刊,是我国第一张提供权威金融证券专业资讯的全国性财经日报。《上海证券报》是新华社重点报刊,中国证监会、保监会、银监会指定信息披露报纸。
今天看啥  ›  专栏  ›  上海证券报

Kimi最新发布!与DeepSeek“撞车”?

上海证券报  · 公众号  · 证券  · 2025-02-19 22:17
    

文章预览

2月18日,月之暗面Kimi发布最新论文《MoBA: Mixture of Block Attention for Long-Context LLMs》(《MoBA:面向长文本大模型的混合块注意力机制》),并公布已部署于Kimi的工程代码。在长文本处理任务中,采用混合块注意力(简称“MoBA”)技术的模型可在保持相近性能的同时,显著降低注意力计算时间及内存消耗。 值得注意的是,DeepSeek也于同期发表论文,提出原生稀疏注意力(简称“NSA”)(详见此前报道《 DeepSeek发布最新技术论文!梁文锋参与署名 》)。有业内专家表示,此次两家公司在注意力机制研究上的“撞车”,有助于人们更好理解强化学习的技术发展,以及更高效更长文本的注意力机制的进化方向。 百万token提速6.5倍 MoBA是一种受专家混合(MoE)和块稀疏注意力(Block Sparse Attention)启发的注意力架构。据悉,在百万token测试中,MoBA比全注意力提 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览