文章预览
1. 什么是 Nsight System分析工具? Nsight Systems 是 NVIDIA 提供的一款系统级性能分析工具,可以帮助我们进行CUDA代码的开发优化以及模型代码的优化。 1.1. 主要功能 系统级分析 :Nsight Systems 能够捕获和分析整个系统的性能数据,包括 CPU 和 GPU 的活动、内存使用情况、线程调度、I/O 操作等。 时间轴视图 :提供详细的时间轴视图,展示不同时间点上系统中各个组件的活动情况。开发者可以通过时间轴视图直观地看到 CPU 和 GPU 任务的执行时间、数据传输时间等。 API 跟踪 :能够跟踪各种 API 调用,如 CUDA API、NVTX(NVIDIA Tools Extension)标记、操作系统线程调度等,帮助开发者了解应用程序的执行流程和时间开销。 2. 如何进行深度学习任务分析? 下面我们首先先来思考两个问题? 为什么深度学习任务提升GPU利用率和性能是比较复杂的过程? 当我们拿到待分
………………………………