今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

深度神经网络在硬件上编译器的深入比较

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-06-28 00:06
    

文章预览

2019年来自清华大学的硬件上DNN编译器综述论文“An In-depth Comparison of Compilers for Deep Neural Networks on Hardware”。 将 NN 模型映射到高性能硬件实现的难度来自多种因素,包括从多个操作的计算复杂性到不同的硬件特性(例如内存分层结构和并行性)。本文介绍一种通用的编译器流程,并对编译器框架的域特定语言(DSL)、中间表示(IR)、优化策略和自动调度方法进行深入比较。基于这些编译器框架,重新实现典型的 NN 模型,并评估最终的性能。另外,回顾之前关于编译器框架和针对定制的基于 FPGA 加速器优化工作(深度神经网络虚拟机,DNNVM),得到有关通用处理器的编译器设计与基于 FPGA 的加速器编译器设计之间差异分析。 如图是DNN编译器的通用框架: 为了将各个应用转换为优化的实现,编译器已使用了几十年[8]。 得益于 CPU 和 GPU 的成熟市场, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览