专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
目录
相关文章推荐
今天看啥  ›  专栏  ›  极市平台

DeepSeek V3论文细节:如何绕开CUDA的垄断!

极市平台  · 公众号  ·  · 2025-01-29 22:00
    

文章预览

↑ 点击 蓝字  关注极市平台 作者丨新智元 来源丨新智元 编辑丨极市平台 极市导读   天才极客微调PTX,让GPU性能极致发挥。   >> 加入极市CV技术交流群,走在计算机视觉的最前沿 DeepSeek 最近发布的两个模型 —— DeepSeek-V3 和 DeepSeek-R1 以很低的成本获得了比肩 OpenAI 同类模型的性能。 根据外媒的报道,他们在短短两个月时间,在 2,048 个 H800 GPU 集群上,训出 6710 亿参数的 MoE 语言模型,比顶尖AI效率高出 10 倍。 这项突破不是用 CUDA 实现的,而是通过大量细粒度优化以及使用英伟达的类汇编级别的 PTX(并行线程执行)编程。 DeepSeek 在硬件受限的条件下被逼走出了一条不同于 OpenAI 等狂堆算力的道路,用一系列技术创新来减少模型对算力的需求,同时获得性能提升。 网友的一些热评: 「在这个世界上,如果有哪群人会疯狂到说出『CUDA 太慢了!干脆 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览