本发明公开了一种舰载机保障人员调度方法,应对甲板舰载机保障作业调度的不确定突发状况。首先将保障人员对舰载机的保障过程构造为马尔科夫决策过程;随后根据该过程特点设计一种改进的Soft Actor Critic(SAC)调度算法:(1)为降低学习难度,将SAC算法拓展为多智能体算法,并添加环境数据处理,减少智能体需处理的环境状态信息;(2)为避免动作冲突情况,设计自适应率以增加调度质量;(3)为优化整体训练过程,设置无效动作屏蔽机制、优先经验回放机制。最后将设计好的算法投入训练,完成训练的智能体即可投入调度。该方法能够较好地应对甲板出现的紧急突发状况,使得甲板调度对于不确定性有着更强的鲁棒性,增加了甲板调度的效率。
本发明旨在提供针对紧急突发状况的舰载机保障作业人员调度算法,提高舰载机保障工作执行效率。为实现以上目的,本发明采用如下技术方案:
步骤1:对于舰载机出动回收流程进行分析,明确其流程特性,并提取出关键需求,为后续步骤设计提出基本要求;
步骤2:根据步骤1所明确特点,确定环境及智能体,并根据环境特点设置状态空间、动作空间及状态转移,同时设计相应奖励函数,建立起整体环境‑智能体训练框架,并确定采用多智能体算法求解该问题模型;
步骤3:对原始环境数据进行处理,根据学习特性,将不必要数据滤去,仅采用必要数据进行决策,减少智能体所需观测值,以此降低学习难度,优化学习过程;
步骤4:基于前述步骤设定及要求,首先因SAC(Soft Actor Critic)算法的鲁棒性强,适用于甲板调度环境,故为SAC算法设计多智能体学习框架,将其应用于多智能体学习,随后为进一步优化其学习过程,采用无效动作屏蔽,使得其学习过程进一步得到优化,再为针对小概率的甲板紧急突发状况进行学习,设置相应优先经验抽取机制,使其能对甲板紧急突发状况进行有效学习,最后为解决动作冲
此技术为哈尔滨理工大学栾添添研发,承担本专科及研究生层次普通高等学历教育工作承担科学技术研究工作
评价单位:“科创中国”河北科技服务团 (河北省数字健康工程学会)
评价时间:2023-10-10
综合评价
技术转让,所需资金需双方协商,此项技术想尽快落地保定,希望具备此项技术研发的技术方,能够尽快承接次项目
查看更多>