专栏名称: CreateAMind
ALLinCreateAMind.AGI.top , 前沿AGI技术探索,论文跟进,复现验证,落地实验。 鼓励新思想的探讨及验证等。 探索比大模型更优的智能模型。
今天看啥  ›  专栏  ›  CreateAMind

双层规划的谓词发明

CreateAMind  · 公众号  ·  · 2024-12-14 18:05
    

主要观点总结

文章讨论了如何通过从演示中学习谓词来优化双层规划的效率。文章提出了一种从演示中学习谓词的算法,以消除手动指定状态抽象的需求。该方法通过优化一个可处理但忠实于实际高效规划目标的代理目标来学习谓词。在四个机器人规划环境中进行实验,发现学习的抽象能够快速解决保留任务,优于六个基线。此外,使用提出的代理目标学习的谓词显著优于其他目标学习的谓词。

关键观点总结

关键观点1: 谓词发明算法

文章提出了一种从演示中学习谓词的算法,用于双层规划。该算法消除了手动指定状态抽象的需求,通过优化代理目标来学习谓词。

关键观点2: 代理目标

算法中使用的代理目标可处理且与实际高效规划目标深度相关,用于指导谓词学习。

关键观点3: 实验环境

在四个机器人规划环境中进行了实验,发现学习的抽象在解决保留任务上表现出高效性,并优于多个基线。

关键观点4: 谓词性能

使用提出的代理目标学习的谓词显著优于使用其他目标函数学习的谓词,提高了双层规划的效率。


文章预览

Predicate Invention for Bilevel Planning 双层规划的谓词发明  https://arxiv.org/pdf/2203.09634 摘要 在连续状态和动作空间中进行高效规划是根本性的难题,即使转移模型是确定性的且已知的。缓解这一挑战的一种方法是使用抽象进行双层规划,其中高层搜索抽象计划用于指导在原始转移空间中的规划。先前的工作表明,当以符号谓词形式的状态抽象是手工设计时,双层规划的操作符和采样器可以从演示中学习。在这项工作中,我们提出了一种从演示中学习谓词的算法,消除了手动指定状态抽象的需求。我们的关键思想是通过优化一个可处理但忠实于我们实际高效规划目标的代理目标来学习谓词。我们使用这个代理目标在从语法中提取的谓词集上进行爬山搜索。实验上,我们在四个机器人规划环境中展示了我们学习的抽象能够快速解决保留任务,优于六个基线。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览