文章预览
导读 在1毫秒内,GPUNet比EfficientNet-X和FBNetV3快2倍,同时准确率更高。 摘要 定制卷积神经网络(CNN)以供生产使用一直是深度学习实践者面临的挑战。本文旨在通过建立一个包含经优化模型的模型库来加速模型定制过程,这些模型按照其推理延迟进行分级,并利用神经架构搜索(NAS)技术。为了实现这一目标,我们构建了一个分布式NAS系统,在一个新颖的搜索空间中进行搜索,该搜索空间包含了影响延迟和准确性的关键因素。因为我们针对GPU平台,我们将NAS优化后的模型命名为GPUNet,它在推理延迟和准确性的Pareto前沿上建立了新的最先进水平。在1毫秒内,GPUNet比EfficientNet-X和FBNetV3快2倍,同时准确率更高。我们还在检测任务上验证了GPUNet,GPUNet在COCO检测任务上无论是在延迟还是准确率方面均一致优于EfficientNet-X和FBNetV3。所有这些数据验证了我们的NA
………………………………