主要分享机器人/自动驾驶智能控制等相关技术。
今天看啥  ›  专栏  ›  机器人规划与控制研究所

端到端自动驾驶算法—模仿学习(Imitation Learning)(二)

机器人规划与控制研究所  · 公众号  ·  · 2024-06-18 10:18
    

文章预览

原文lecture作者:Andreas Geiger 教授、博士 / 自主视觉小组/图宾根大学 /MPI-IS。 接着上篇文章: 端到端自动驾驶算法—模仿学习(Imitation Learning)(一) optimization 优化器 (1)神经网络损失函数 L(X , w) 不是凸的,我们必须使用梯度下降 (2)存在多个局部最小值,但我们通过优化只会找到一个 (3)好消息:众所周知,深度网络中的许多局部最小值都是好的。 反向传播 (1)向前高效计算值,向后高效计算梯度 (2)模块化:每个节点必须只“知道”如何计算梯度,相对于它自己的参数 (3)每个数据点一次 fw/bw 传递 梯度下降 算法 1. 初始化权重 w0 并选择学习率 η 2. 对于所有数据点 i ∈ {1, . . . , N} 执行:             2.1 通过网络正向传播 xi 以计算预测 ˆyi             2.2 反向传播以获得梯度 ∇wLi(wt) ≡ ∇wL(ˆyi, yi, wt) 3. 更新梯度:wt+1 = ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览