文章预览
基于Transformer的强化学习(TRL) 是一种利用Transformer模型架构来改进和增强强化学习算法性能的方法。 这种方法通过结合Transformer模型强大的表示能力和强化学习的决策优化框架,显著提升了智能体的学习能力和适应能力,为我们解决复杂环境下的决策问题提供了新的思路,因此也被广泛应用于各大领域。 目前,TRL主要有两大发展方向: 架构增强、轨迹优化 。今天我从这两大方向入手,分享 29篇 TRL的代表性成果 ,为方便同学们理解,这其中还包含了TRL在自动驾驶等主要领域的热门应用,希望对大家找idea有所帮助。 扫码 添加小享,回复“ 强化注意 ” 免费获取 全部 论 文+开源代码 1.架构增强 将Transformer结构融入强化学习框架,以提升对状态、动作和历史信息的建模能力,从而精确地表示智能体与环境间的复杂关系。 代表性论文: Coberl: Contra
………………………………