专栏名称: CreateAMind
ALLinCreateAMind.AGI.top , 前沿AGI技术探索,论文跟进,复现验证,落地实验。 鼓励新思想的探讨及验证等。 探索比大模型更优的智能模型。
今天看啥  ›  专栏  ›  CreateAMind

R-AIF: 超越DreamerV3最强强化学习世界模型

CreateAMind  · 公众号  ·  · 2024-10-18 11:12

文章预览

R-AIF: SOLVING SPARSE-REWARD ROBOTIC TASKS FROMPIXELS WITH ACTIVE INFERENCE AND WORLD MODELS R-AIF:基于主动推理和世界模型的稀疏回报机器人任务求解  https://arxiv.org/pdf/2409.14216 https://github.com/NACLab/robust-active-inference  摘要 尽管研究已经产生了令人鼓舞的结果,证明了主动推理( AIF )在马尔可夫决策过程(MDPs)中的实用性,但在以部分可观察马尔可夫决策过程( POMDPs )形式出现的环境和问题背景下构建AIF模型的工作相对较少。在POMDP场景中,智能体必须从 原始感官观察(例如图像中的像素)中推断出未观察到的环境状态 。此外,针对POMDP为中心的控制中 最困难的形式——稀疏奖励信号下的连续动作空间POMDP的研究也较少。 在本文中,我们通过引入新颖的 先验偏好学习技术和自我修正计划, 解决了AIF建模范式所面临的问题,从而帮助智能体在 稀疏奖励、连续动作、 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览