文章预览
来自:清华大学 强化学习方法被广泛用于无人机、机械臂、双足机器人和智能汽车等机器人控制领域。然而,仿真环境和真实环境的差异,制约了强化学习方法的落地应用。以智能汽车为例,车辆行驶过程面临多源不确定性的挑战,包括周车行为难以预测所引入的外部干扰、模型参数难以估计所引入的模型误差和环境感知所带来的观测噪声等。这些不确定性将耦合影响机器人的运动控制性能,运动控制策略的鲁棒性是制约强化学习技术落地应用的关键挑战。 诞生于上世纪 70 年代末的鲁棒控制旨在解决被控对象模型的不确定性。 1988 年, Doyle 等人发表著名的 DGKF 论文 [1] ,为状态空间线性鲁棒控制奠定了理论基础。鲁棒控制的设计目标是抑制不确定性对控制性能的影响,其中控制输入和不确定性存在博弈关系。据此, Başar 透过零和博弈视角,将
………………………………