手机:16601807362,可咨询购买自动驾驶开发套件、自动驾驶教学平台及解决方案、线控底盘、Mobileye相机、德尔福和博世4D雷达、激光雷达。
今天看啥  ›  专栏  ›  人工智能AI大模型与汽车自动驾驶

部署新思路 | Minuet:在 GPU 上加速 3D 稀疏卷积

人工智能AI大模型与汽车自动驾驶  · 公众号  ·  · 2024-06-06 11:08
    

文章预览

原标题:Minuet: Accelerating 3D Sparse Convolutions on GPUs 论文链接:https://arxiv.org/pdf/2401.06145.pdf 代码链接:https://github.com/UofT-EcoSystem/Minuet 作者单位:多伦多大学 Vector Institute Amazon Meta Samsung AI Centre Toronto CentML 会议:EuroSys'24 论文思路: 稀疏卷积(Sparse Convolution) (SC) 广泛用于处理本质上稀疏的 3D 点云。与密集卷积不同,SC 通过仅允许输出到特定位置来保留输入点云的稀疏性。为了有效地计算 SC,现有的 SC 引擎(engines)首先使用哈希表来构建内核映射(kernel map),该映射存储要执行的必要的通用矩阵乘法(GEMM)操作 (Map 步骤),然后使用 Gather-GEMM-Scatter 过程来执行这些 GEMM 操作 (GMaS 步骤)。在这项工作中,本文分析了现有最先进的 SC 引擎的缺点,并提出了 Minuet,一种专为现代 GPU 量身定制的新型内存高效 SC 引擎。Minuet 提出 (i) 用一种新颖的分段排序双遍历二分 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览