如何通过链式法则计算损失对各层权重的梯度

人机与认知实验室 · 公众号 · · 2024-11-02 00:00

文章预览

通过链式法则计算损失对各层权重的梯度是反向传播算法的核心。我们可以用一个简单的神经网络示例来说明这个过程。示例：简单的两层神经网络假设我们有一个简单的神经网络，包括一个输入层、一个隐藏层和一个输出层。输入层： 𝑋 隐藏层：权重为 𝑊 1 ，激活函数为 𝑓 输出层：权重为 𝑊 2 ，损失函数为 𝐿 一、前向传播计算隐藏层输出： 𝑍 1 = 𝑊 1 𝑋 𝐴 1 = 𝑓 ( 𝑍 1 ) 计算输出层输出： 𝑍 2 = 𝑊 2 𝐴 1 𝐴 2 = 𝑔 ( 𝑍 2 ) 其中 𝑔 是输出层的激活函数（例如Sigmoid或Softmax）。计算损失： 𝐿 = Loss ( 𝐴 2 , 𝑌 ) 其中 𝑌 是真实标签。 2. 反向传播计算损失对输出层权重的梯度 ∂ 𝐿/ ∂ 𝑊2 计算输出层误差： 𝛿 2 = ∂ 𝐿 ∂ 𝐴 2 ⋅ 𝑔 ′ ( 𝑍 2 ) 这里， 𝑔 ′ 是输出激活函数的导数。计算权重梯度： ∂ ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博