文章预览
作 者:Hcamael @ 知道创宇404实验室 时间: 2025年2月25日 在本系列的 上一篇文章 中 ,我们学习了如何训练一个识别数字图片的神经网络,在本篇文章中将会在此基础上学习一些进阶知识。 1. 引入非线性算法 参考资料 在上一篇文章中,我们的神经网络使用的是线性算法,现在我们在此基础上转化为非线性算法,相关代码如下所示: # 定义 CNN 模型 class numCNN(nn.Module): def __init__(self, input_size= 28 * 28 , output_size= 10 , batch_size= 64 ): super(numCNN, self).__init__() # 定义一个 (10, 784) 的权重矩阵 self.weight = nn.Parameter(torch.randn(input_size, output_size) * 0.01 ) # (784, 10) # 定义一个长度为10的偏置向量 self.bias = nn.Parameter(torch.randn(output_size) * 0.01 ) self.batch_size = batch_size self.batch_size_range = range(batch_size) self.real_answer = torch.zeros(sel
………………………………