专栏名称: 奇偶工作室
Leo和基哥联手,打造有趣有料有情怀的科技号。一点资讯视频榜TOP10、科技前瞻奖。网易新闻年度短视频风云作者、网易短视频签约达人。
今天看啥  ›  专栏  ›  奇偶工作室

DeepSeek重磅发布!实习生挑大梁,梁文锋亲自参与

奇偶工作室  · 公众号  ·  · 2025-02-20 06:20
    

文章预览

奥特曼,外面都是梁文锋。 最近梁文锋很忙。 2月17日飞去北京,参加最高规格的民企座谈会。 (坐马化腾隔壁) 飞北京的前一天,2月16日还上传了一篇技术大突破的论文。 2月18日,DeepSeek官方就发布了这篇论文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》。 主要内容是是关于NSA(Natively Sparse Attention,原生稀疏注意力),一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。 简单来说,就是教会AI“一目十行”,这就像我们读书时,我们会专注于关键段落,重要的句子看,并快速浏览其余部分。抓住重点来理解文章意思。 这项技术有望大幅提升下一代大语言模型,处理长文本的能力,同时还能兼顾效率,可谓是AI大模型,里程碑式的进展。 当然,大家也不忘@了下OpenAI的的奥特曼:看,梁文锋的DeepS ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览