三家美国巨头同日接入DeepSeek，业内人士：DeepSeek或准备适配国产GPU

新黄河 · 公众号 · AI 科技自媒体 · 2025-02-01 14:00

主要观点总结

文章主要围绕“DeepSeek”技术展开，介绍了其引起的全球关注、技术特点、与CUDA的关系、内部开发者的技能、以及其在工程上的技巧和未来前景。

关键观点总结

关键观点1: DeepSeek引起全球关注

各路业内人士仍在从不同角度深入分析DeepSeek的模型和技术，英伟达宣布DeepSeek-R1模型登陆NVIDIANIM，亚马逊和微软也接入此模型，且DeepSeek被誉为最先进的大语言模型。

关键观点2: DeepSeek技术特点

DeepSeek在研发时绕过了CUDA，使用英伟达的PTX语言。这可以让开发者更精细地控制GPU，但需要专业度较高的开发者。使用PTX写出来的代码非常复杂，且很难维护。

关键观点3: DeepSeek的工程技巧

DeepSeek的技术报告表明其在工程上非常有技巧，其主体实现还是基于CUDA的相关接口。如果有内部开发者擅长写PTX语言，那么未来使用国产GPU时，其在硬件适配方面将会更得心应手。

关键观点4: DeepSeek的未来前景

由于DeepSeek的技术实力和工程技巧，未来不排除有更多GPU厂商与其合作。同时，美国对华制裁可能激发其紧迫感和创造力。

文章预览

尽管春节假期已经过半，但是“来自东方的神秘力量的 DeepSeek”仍在引起全世界热议，各路业内人士也仍在从不同角度分析 DeepSeek 的模型和技术文章。北京时间1月31日，英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。同一时段内，亚马逊和微软也接入DeepSeek-R1模型。英伟达称，DeepSeek-R1是最先进的大语言模型。韩国 Mirae Asset Securities Research 的一名分析师在 X 撰写长文分析称：“这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程，而非通过英伟达 CUDA 中的某些功能来实现的。” （来源：X）也就是说 DeepSeek 在研发大模型时绕过了 CUDA。CUDA（Compute Unified Device Architecture，统一计算架构），是由英伟达开发的一种通用编程框架，它允许开发者利用英伟达的图形处理器（GPU，Graphics Processing Unit）进行通用计算。如果 DeepSeek 真的绕过了 CUDA，那么这 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博