未来马赛克战可分为红方指挥控制中心、红方无人机防卫部队、蓝方地面部队、蓝方空中部队。蓝方为攻击红方指挥控制中心,需要通过迂回穿插突破红方防御网,而红方无人机群需要不断调整巡航策略以实现有效防御。根据强化学习训练模型对战场环境进行建模,将红方无人机抽象为障碍物,蓝方坦克抽象为智能体,将整个任务转化为障碍物动态变化的迷宫问题,从而构建红蓝对抗体系数字空间,支撑未来数字孪生战场建设。首先以蓝方地面坦克部队视角探索博弈过程。博弈第一阶段,考虑红方无人机定速巡航时蓝方完成穿插任务的方式。此时蓝方基于Gym构建强化学习训练环境,模拟坦克和无人机的运动,基于PARL框架进行编码,使用策略梯度算法进行训练和测试,最终神经网络收敛并得到正确的穿插路径。博弈第二阶段,考虑红方如何调整巡航策略以对抗人工智能算法。此时引入量子防御策略,量子防御的核心是基于自然随机数决定是否移动,此时环境表现为障碍物无规律移动,不再具有马尔可夫性,蓝方无法应用神经网络进行求解。将量子防御应用于真实战场,表现为红方无人机随机调整巡航速度,整个机群不再保持稳态,形成动态变化的量子防御体系,从而对抗蓝方人工智能算法。博弈第三个阶段,
亮点1:应用强化学习解决复杂动态环境下的区域穿插问题
将红蓝对抗中的典型场景抽象为智能体序列决策的马尔可夫过程,采用强化学习进行训练,最终获得具有一定决策能力的模型
亮点2:设计战损条件下的分级防御机制
提出一种战损条件下的量子防御策略,在量子防御策略基础上提出自定义随机策略,在保证随机性的同时保证可控性
亮点3:引入先进人工智能算法支持未来数字孪生战场的构建
通过在红蓝对抗中引入先进的人工智能算法,为未来数字孪生战场的构建提供算法支持,加速未来战场中指挥策略的改变和更新
团队是一支来自国内顶尖院校的博士、硕士组成的高水平产研结合青年骨干队伍,在计算机视觉、强化学习、知识图谱、语音识别等领域积累了丰富的技术沉淀,获得多项专利,同时打造了面向航空制造的AI服务平台。
评价单位:“科创中国”航空制造产业科技服务团 (中国航空学会)
评价时间:2023-11-27
综合评价
方案很棒,建议补充团队成员具体单位或学校;创新点突出,方案完整,应用场景明确。
马赛克战下区域穿插与防御,创意很好,下一步建议加强测试使得项目落地,并且研究其具体的作战运用场景
该项目基于强化学习开展智能决策研究,建议增加复杂对抗场景的分析研究,从作战的角度进一步落实其军事应用价值。
通过强化学习算法解决无人机自主飞行时的避障问题,提高无人机完成任务的成功率。
查看更多>