文章预览
近年来,随着 o1 或 Deepseek-r1 等推理模型在复杂决策和推理任务中的迅速发展,强化学习(Reinforcement Learning, RL)在模型训练与推理优化中的价值越发凸显。通过对庞大搜索空间进行有效探索与学习,RL 在机器决策和自动化设计等多个领域发挥了重要作用。 基于这一趋势,我们希望 将强化学习引入社区建筑布局生成 这一更具挑战性的场景,利用多智能体协同来高效探索布局空间并满足多重设计需求。 建筑布局设计对建筑师来说是一项耗时且劳动密集的任务,行业需要高度自动化的方法。与近来有较多研究的室内布局生成相比,社区建筑布局生成由于建筑间隔和容积率等限制而面临更多挑战。现有的依赖于规则或启发式搜索的算法难以平衡这些因素。此外,缺乏用于评估的数据集。 我们为该任务定义状态、动作空间和奖励函数,提出了一种 基于多
………………………………