文章预览
原标题:Minuet: Accelerating 3D Sparse Convolutions on GPUs 论文链接:https://arxiv.org/pdf/2401.06145.pdf 代码链接:https://github.com/UofT-EcoSystem/Minuet 作者单位:多伦多大学 Vector Institute Amazon Meta Samsung AI Centre Toronto CentML 会议:EuroSys'24 论文思路: 稀疏卷积(Sparse Convolution) (SC) 广泛用于处理本质上稀疏的 3D 点云。与密集卷积不同,SC 通过仅允许输出到特定位置来保留输入点云的稀疏性。为了有效地计算 SC,现有的 SC 引擎(engines)首先使用哈希表来构建内核映射(kernel map),该映射存储要执行的必要的通用矩阵乘法(GEMM)操作 (Map 步骤),然后使用 Gather-GEMM-Scatter 过程来执行这些 GEMM 操作 (GMaS 步骤)。在这项工作中,本文分析了现有最先进的 SC 引擎的缺点,并提出了 Minuet,一种专为现代 GPU 量身定制的新型内存高效 SC 引擎。Minuet 提出 (i) 用一种新颖的分段排序双遍历二分
………………………………