今天看啥  ›  专栏  ›  机器人规划与控制研究所

自动驾驶算法——理解强化学习(五)

机器人规划与控制研究所  · 公众号  ·  · 2024-12-18 18:49
    

文章预览

机器人规划与控制研究所  ——机器人/自动驾驶规划与控制方向综合、全面、专业的平台。2万人订阅的微信大号。点击标题下蓝字“机器人规划与控制研究所”关注,我们将为您提供有价值、有深度的延伸阅读。 首先回顾这个系列前几篇文章: 自动驾驶算法——理解强化学习(一)  和  自动驾驶算法——理解强化学习(二) 和 自动驾驶算法——理解强化学习(三) 和 自动驾驶算法——理解强化学习(四) 。 整合学习和规划 我们已经讨论了很多关于直接从经验中学习策略和直接从经验中学习价值函数的内容。但是,我们如何才能让模型直接从经验中学习并构建价值函数或策略呢?这里的目标主要是将学习和规划集成到一个架构中。这可以通过 基于模型的强化学习来实现。 那么这与无模型 RL 有什么区别? 来源 无模型 RL 的样子如下: 来源 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览