文章预览
人工智能技术的发展极大推动了智能博弈决策问题求解范式的变革,从最优解、均衡解到适
变解,如何构建基于生成式大模型的智能博弈自适应决策智能体充满挑战。博弈强对抗环境中兵力
分配和多实体协同是研究排兵布阵和作战协同的核心课题。基于技能、排序和偏好元博弈模型构建
的策略强化学习、策略博弈树搜索与策略偏好投票选择方法,设计了满足生成时规划的大模型智能
体架构。该架构可对齐指挥员意图,具有可行性、适用性、扩展性,可为自适应决策过程提供可解
释性策略推荐。从基座模型构建、目标引导博弈强化学习和开放式元博弈策略学习分析了关键技术
需求。期望为强化学习类模型、博弈学习类模型与生成式大语言模型结合的交叉研究提供参考。 为了推进美国战略与预算评估中心提出的“决
策中心战”,DARPA 于 2017 年提
………………………………