专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

通过在actor-critic递归架构中使用卡尔曼滤波层进行序列-20240930051816

爱可可-爱生活  · 微博  · AI  · 2024-09-30 05:18

文章预览

2024-09-30 05:18 本条微博链接 通过在actor-critic递归架构中使用卡尔曼滤波层进行序列建模,改进了部分可观测强化学习任务中的状态表示,尤其适用于需要状态不确定性推理的任务。 [LG]《Uncertainty Representations in State-Space Layers for Deep Reinforcement Learning under Partial Observability》C E. Luis, A G. Bottero, J Vinogradska, F Berkenkamp ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览