今天看啥  ›  专栏  ›  今日新材料

研究前沿:深度强化学习算法 | Nature Machine Intelligence

今日新材料  · 公众号  ·  · 2025-01-02 18:22
    

文章预览

深度强化学习算法的样本效率不高,需要大量的情节,才能达到最佳性能。情景强化学习算法,旨在通过扩展记忆系统,利用过去的经验,以克服这个问题。然而,这些内存扩展,通常仅用作缓冲区,从中对孤立的事件进行重新采样,以进行离线学习(例如,重放)。 近日,法国索邦大学(Sorbonne Université)Paul F. M. J. Verschure,荷兰 拉德堡德大学 (Radboud University)Adrián F. Amil,西班牙 米格尔·埃尔南德斯·德埃尔切大学(Universidad Miguel Hernandez de Elche)Paul F. M. J. Verschure,在Nature Machine Intelligence上发文,介绍了顺序情景控制 Sequential Episodic Control (SEC),这是一种受海马启发的模型,以时间顺序存储整个事件序列,并在检索中使用顺序偏差,以指导行动。 在Animal-AI Testbed各种基准测试中,对顺序情景控制SEC进行了评估,相比于几个最先进的模型(包括无 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览