文章预览
R-AIF: SOLVING SPARSE-REWARD ROBOTIC TASKS FROMPIXELS WITH ACTIVE INFERENCE AND WORLD MODELS R-AIF:基于主动推理和世界模型的稀疏回报机器人任务求解 https://arxiv.org/pdf/2409.14216 https://github.com/NACLab/robust-active-inference 摘要 尽管研究已经产生了令人鼓舞的结果,证明了主动推理( AIF )在马尔可夫决策过程(MDPs)中的实用性,但在以部分可观察马尔可夫决策过程( POMDPs )形式出现的环境和问题背景下构建AIF模型的工作相对较少。在POMDP场景中,智能体必须从 原始感官观察(例如图像中的像素)中推断出未观察到的环境状态 。此外,针对POMDP为中心的控制中 最困难的形式——稀疏奖励信号下的连续动作空间POMDP的研究也较少。 在本文中,我们通过引入新颖的 先验偏好学习技术和自我修正计划, 解决了AIF建模范式所面临的问题,从而帮助智能体在 稀疏奖励、连续动作、
………………………………