太猛了！英伟达让 Deepseek R1 编写 GPU 内核，结果 R1 写的比熟练工程师还好

AI寒武纪 · 公众号 · · 2025-02-14 20:45

文章预览

DeepSeek 又上大分！英伟达使用 DeepSeek-R1 让 AI 自动生成 GPU 内核代码，结果效果超越人类工程师，更离谱的是在 KernelBench Level 1 上实现了 100% 的数值正确性我们一起来扒一扒事情原委：随着 AI 模型越来越强大，要解决的问题也越来越复杂。这时候，一种叫做 “推理时序 scaling” (inference-time scaling) 的新技巧就火了起来，听起来高大上，其实说白了，就是给 AI 更多的时间去思考！就像我们人类解难题一样，难题太复杂？那就多花点时间，多想想不同的解法，最终选出最优方案！“推理时序 scaling” 就是让 AI 在推理过程中，分配更多的计算资源，尝试更多可能性，最终找到最佳答案。这也被称为 AI 的“reasoning” 或 “long-thinking” (长思考) 能力这次 Nvidia 的工程师们就用 DeepSeek-R1 模型，加上 “推理时序 scaling” 技术，搞了个实验， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

Linux就该这么学 · Fedora即将登陆Win10/11 Linux 子系统，社区“捉虫”活动启动

昨天

Linux就该这么学 · 成为 Linux 命令行高手！365个必备命令和技巧，轻松提升效率，都是干货

昨天

Linux就该这么学 · 微信新功能升级：可一次性删除所有“单向好友”

昨天

Linux就该这么学 · 网络工程师这样用，简直是要榨干 DeepSeek 了！

2 天前

Linux就该这么学 · 大佬必备！99% 的 Nginx 安全问题都能用这些方法解决！

3 天前

调研纪要 · 李录：几条常识

5 月前

马蜂窝 · 不挤大理版纳，去这个0游客小城过冬！不仅温度适宜，物价便宜，能喝到国内最好的咖啡，还是中国牛油果之乡！

3 月前