专栏名称: Ai fighting
本公众号主要分享自动驾驶感知实战,从算法训练到模型部署。主要致力于3D目标检测,3D目标追踪,多传感器融合,Transform,BEV,OCC,模型量化,模型部署等方向的实战。
今天看啥  ›  专栏  ›  Ai fighting

自动驾驶算法——强化学习(一)

Ai fighting  · 公众号  ·  · 2024-08-25 22:37

文章预览

原文lecture作者:Andreas Geiger 教授、博士 / 自主视觉小组/图宾根大学 /MPI-IS. 1.马尔可夫决策过程 到目前为止:          1.学习,需要大量专家演示          2.使用辅助短期损失函数          3.模仿学习:动作的每帧损失          4.直接感知:可供性指标的每帧损失     现在:          1.基于我们真正关心的损失学习模型,例如:              (1) 最小化到达目标位置的时间              (2) 最小化碰撞次数              (3) 最小化风险              (4) 最大化舒适度  欢迎加入自动驾驶实战群 学习的类型 1. 监督学习: (1)数据集:{(xi , yi)} (xi = 数据, yi = 标签) 目标: 学习映射 x 7→ y (2)示例:分类、回归、模仿学习、可供性学习等。 2. 无监督学习: (1)数据集:{(xi)} (xi = 数据) 目标:发现数据底层结 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览