专栏名称: Ai fighting
本公众号主要分享自动驾驶感知实战,从算法训练到模型部署。主要致力于3D目标检测,3D目标追踪,多传感器融合,Transform,BEV,OCC,模型量化,模型部署等方向的实战。
目录
相关文章推荐
今天看啥  ›  专栏  ›  Ai fighting

GPUNet:来自NVIDIA为GPU定制的卷积网络

Ai fighting  · 公众号  ·  · 2024-08-29 23:00
    

文章预览

导读 在1毫秒内,GPUNet比EfficientNet-X和FBNetV3快2倍,同时准确率更高。 摘要 定制卷积神经网络(CNN)以供生产使用一直是深度学习实践者面临的挑战。本文旨在通过建立一个包含经优化模型的模型库来加速模型定制过程,这些模型按照其推理延迟进行分级,并利用神经架构搜索(NAS)技术。为了实现这一目标,我们构建了一个分布式NAS系统,在一个新颖的搜索空间中进行搜索,该搜索空间包含了影响延迟和准确性的关键因素。因为我们针对GPU平台,我们将NAS优化后的模型命名为GPUNet,它在推理延迟和准确性的Pareto前沿上建立了新的最先进水平。在1毫秒内,GPUNet比EfficientNet-X和FBNetV3快2倍,同时准确率更高。我们还在检测任务上验证了GPUNet,GPUNet在COCO检测任务上无论是在延迟还是准确率方面均一致优于EfficientNet-X和FBNetV3。所有这些数据验证了我们的NA ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览