专栏名称: CreateAMind
ALLinCreateAMind.AGI.top , 前沿AGI技术探索,论文跟进,复现验证,落地实验。 鼓励新思想的探讨及验证等。 探索比大模型更优的智能模型。
今天看啥  ›  专栏  ›  CreateAMind

Q*搜索:基于深度Q网络的启发式搜索

CreateAMind  · 公众号  ·  · 2025-01-09 17:51
    

文章预览

https://prl-theworkshop.github.io/prl2024-icaps/papers/9.pdf Q* Search: Heuristic Search with Deep Q-Networks Q*搜索:基于深度Q网络的启发式搜索 摘要   几十年来,高效解决具有大动作空间的问题一直是人工智能社区的重要课题。这是因为A*搜索的计算和内存需求随着动作空间的大小线性增长。当A*搜索使用由计算成本高昂的函数逼近器(如深度神经网络)学习的启发式函数时,这种负担变得更加明显。为了解决这个问题,我们提出了Q*搜索,这是一种利用深度Q网络引导搜索的算法,以利用一个事实:通过一次前向传播深度Q网络,可以计算一个节点的子节点的转移成本和启发式值的总和,而无需显式生成这些子节点。这显著减少了计算时间,并且每次迭代只需生成一个节点。我们在不同领域和动作空间中使用Q*搜索,结果表明,随着动作大小的增加,Q*搜索仅受到较小的运 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览