主要介绍深度学习、强化学习、深度强化学习环境、算法原理与实现、前沿技术与论文、开源项目、场景应用等与DRL相关的知识
今天看啥  ›  专栏  ›  深度强化学习实验室

开放式物理RL环境空间,智能体零样本解决未见过人类设计环境!

深度强化学习实验室  · 公众号  ·  · 2024-11-25 09:00
    

文章预览

转载自:机器之心 智能体零样本解决未见过人类设计环境!全靠这个开放式物理RL环境空间 当物理推理能力进化后,通用强化学习智能体能在2D物理环境中执行多样化任务了。 在机器学习领域,开发一个在未见过领域表现出色的通用智能体一直是长期目标之一。一种观点认为,在大量离线文本和视频数据上训练的大型 transformer 最终可以实现这一目标。 不过,在离线强化学习(RL)设置中应用这些技术往往会将智能体能力限制在数据集内。另一种方法是使用在线 RL,其中智能体通过环境交互自己收集数据。 然而,除了一些明显的特例外,大多数 RL 环境都是一些狭窄且同质化的场景,限制了训练所得智能体的泛化能力。 近日,牛津大学的研究者提出了 Kinetix 框架,它可以表征 2D 物理环境中广阔的开放式空间,并用来训练通用智能体。 论文地址:htt ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览