专栏名称: 自动驾驶之心
自动驾驶开发者社区,关注计算机视觉、多维感知融合、部署落地、定位规控、领域方案等,坚持为领域输出最前沿的技术方向!
今天看啥  ›  专栏  ›  自动驾驶之心

CUDA卷积算子手写详细实现

自动驾驶之心  · 公众号  ·  · 2024-08-13 07:59
    

文章预览

作者 | Pegessi  编辑 | 自动驾驶之心 原文链接:https://zhuanlan.zhihu.com/p/613538649 点击下方 卡片 ,关注“ 自动驾驶之心 ”公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >> 点击进入→ 自动驾驶之心 『 CUDA编程 』 技术交流群 本文只做学术分享,如有侵权,联系删文 导读   本篇文章主要介绍如何利用CUDA实现一个2D卷积算子,实现过程较为简单,最终的实现效果可以在较小的尺寸下取得比cudnn快较大的性能。实测在以下参数配置下可以达到平均1.2倍cudnn的性能。 前言 CUDA介绍(from chatGPT) 现在深度学习大行其道,作为深度学习的基础软件设施,学习cuda也是很有意义的。本篇文章主要介绍如何利用CUDA实现一个2D卷积算子,实现过程较为简单,最终的实现效果可以在 较小的尺寸 下取得比cudnn快较大的性能。实测在以下参数配置下可以达到平均1.2倍cud ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览