文章预览
前言 我们在构造模型尤其是进行层之间输入输出涉及到的数据格式演算的时候,一些常用的数据处理函数如张量计算、广播机制等等十分重要,以及后面使用Transformers库使用预训练模型的时候仍然不可或缺。本文致于用一文内容讲解到最常用的Pytorch处理函数的使用,以便日后反复查看。 Transformers 库建立在 Pytorch 框架之上(Tensorflow 的版本功能并不完善),虽然官方宣称使用 Transformers 库并不需要掌握 Pytorch 知识,但是实际上我们还是需要通过 Pytorch 的 DataLoader 类来加载数据、使用 Pytorch 的优化器对模型参数进行调整等等。 因此,本章将介绍 Pytorch 的一些基础概念以及后续可能会使用到的类,让大家可以快速上手使用 Transformers 以及Pytorch 库建立模型。 1. Pytorch 基础 Pytorch (https://pytorch.org/) 由 Facebook 人工智能研究院于 2017 年推出,具有强大的 G
………………………………