研究前沿：深度强化学习算法 | Nature Machine Intelligence

今日新材料 · 公众号 · · 2025-01-02 18:22

文章预览

深度强化学习算法的样本效率不高，需要大量的情节，才能达到最佳性能。情景强化学习算法，旨在通过扩展记忆系统，利用过去的经验，以克服这个问题。然而，这些内存扩展，通常仅用作缓冲区，从中对孤立的事件进行重新采样，以进行离线学习（例如，重放）。近日，法国索邦大学（Sorbonne Université）Paul F. M. J. Verschure，荷兰拉德堡德大学 (Radboud University）Adrián F. Amil，西班牙米格尔·埃尔南德斯·德埃尔切大学（Universidad Miguel Hernandez de Elche）Paul F. M. J. Verschure，在Nature Machine Intelligence上发文，介绍了顺序情景控制 Sequential Episodic Control (SEC)，这是一种受海马启发的模型，以时间顺序存储整个事件序列，并在检索中使用顺序偏差，以指导行动。在Animal-AI Testbed各种基准测试中，对顺序情景控制SEC进行了评估，相比于几个最先进的模型（包括无 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

汇易咨询 · ICE菜籽动态巡览：植物油市场扰动，ICE 菜籽走势震荡

2 小时前

看电视 · 长视频2024：让人眼前一亮又一亮的一年

昨天

汇易咨询 · 新年DCE生猪期货合约喜迎“开门红”，国内现货市场强势走高

3 天前

汇易咨询 · 全球产能收缩与我国出口量大增，我国蛋氨酸市场全年价格维持相对高位水平

4 天前

汇易咨询 · 2024年盘点：国产转基因玉米生产安全证书获批知多少？

4 天前

77度 · 京东销售额增长50%！抖音增长40%！南康家具618成绩单出炉

6 月前

撸猫教授 · 猫店长来巡店了，大家都注意点

6 月前