注册登录

专栏名称: Dots机构投资者社区

机构投资者组成的社区，深度点评财经事件

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

廣告狂人 · 专访台湾奥美创意长龚大中：没有方案别进会议室 · 8 小时前

销售与市场 · 新造车“五强”：理想夺冠，小米猛追 · 13 小时前

品牌几何 · 热点速览 | 罗永浩又创业了？ ... · 昨天

今天看啥 › 专栏 › Dots机构投资者社区

天下苦英伟达久矣！PyTorch官方免CUDA加速推理，Triton时代要来？

Dots机构投资者社区 · 公众号 · · 2024-09-15 08:15

文章预览

本文转自微信公众号“机器之心”，作者：机器之心。编辑：杜伟、小舟近日，PyTorch 官方分享了如何实现无 CUDA 计算，对各个内核进行了微基准测试比较，并讨论了未来如何进一步改进 Triton 内核以缩小与 CUDA 的差距。在做大语言模型（LLM）的训练、微调和推理时，使用英伟达的 GPU 和 CUDA 是常见的做法。在更大的机器学习编程与计算范畴，同样严重依赖 CUDA，使用它加速的机器学习模型可以实现更大的性能提升。虽然 CUDA 在加速计算领域占据主导地位，并成为英伟达重要的护城河之一。但其他一些工作的出现正在向 CUDA 发起挑战，比如 OpenAI 推出的 Triton，它在可用性、内存开销、AI 编译器堆栈构建等方面具有一定的优势，并持续得到发展。近日，PyTorch 官宣要做「无英伟达 CUDA 参与的大模型推理」。在谈到为什么要 100% 使用 Triton 进行探索时 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

廣告狂人 · 专访台湾奥美创意长龚大中：没有方案别进会议室

8 小时前

销售与市场 · 新造车“五强”：理想夺冠，小米猛追

13 小时前

品牌几何 · 热点速览 | 罗永浩又创业了？马斯克有望实现ai领域突破

昨天

上海长宁 · 柏涛：不嫌脏臭，不怕苦累，一人当一队

6 月前

哲学王读书 · 唯一在世的中共一代领导人，现107岁，你知道他是谁吗？

6 月前

生命科学前沿 · 乙肝研究新突破，复旦团队开发新型siHBV+mRNA联合疗法

5 月前

EETOP · 经典半导体制造工艺PPT(2000页）

4 月前

澎湃新闻 · 读懂城市｜深圳厚植新质生产力，光明科学城何以成“关键落子”

3 周前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号