您所在的位置: 成果库 一种基于强化学习的工作排程优化方法

一种基于强化学习的工作排程优化方法

发布时间: 2023-09-15

来源: 科技服务团

基本信息

合作方式: 技术转让
成果类型: 发明专利
行业领域:
电子信息技术,信息安全技术
成果介绍
本发明提出一种基于强化学习的工作排程优化方法,旨在通过考虑员工实时疲劳程度,优化员工工作排程,进而缩短最大完工时间。首先,分析员工工作与休息状态下的效率变化曲线,构建工作‑休息排程的数学模型,将员工作业流程建立为马尔可夫决策过程;其次,基于SAC(Soft Actor Critic)算法设计智能体决策框架,实时调整员工工作与休息时长,以最大限度提高员工平均工作效率;此外,设计工作量快速适应机制,仅通过少量迁移训练,实现快速适应不同任务目标。仿真结果表明本发明能够优化员工工作排程方案,缩短最大完工时间,同时在工作量任务较大的情况下,可得到更好的优化效果,工作量快速适应机制使模型可以更灵活的应用于动态场景中。
成果亮点
针对现有技术存在的问题,本发明提出了一种基于强化学习的工作排程优化方法。构建工作人员疲劳模型,并采用基于SAC算法的工作排程算法对其进行快速工作排程,调整员工工作与休息时长,提高员工平均工作效率,且在工作量发生变化时,对不同的工作量有一定快速响应能力。 为达到以上目的,本发明采用如下具体技术方案予以解决: S1:分析员工工作与休息状态下的效率变化曲线,构建工作‑休息排程的数学模型,采用***次幂函数模拟休息时间对疲劳恢复的关系,采用三次函数模拟疲劳积累与工作时间的关系,每执行一次工作和休息过程的交替,为一次工息循环,反复进行工息循环,直至完成整个工作量; S2:初始化设定,建立员工作业流程所对应马尔可夫决策过程,包含以下步骤: ***:设定环境状态集S,环境状态集为: S={WT,Ew,Er,twork_last,trest_last,ttotal} (3) 式中,WT为当前工息循环的剩余工作量,Ew为上一工息循环中工作过程结束时的工作效率,Er为当前时刻工作效率,twork_last
团队介绍
此技术为哈尔滨理工大学栾添添研发,承担本专科及研究生层次普通高等学历教育工作承担科学技术研究工作
成果资料
产业化落地方案
点击查看
成果综合评价报告

评价单位:“科创中国”河北科技服务团 (河北省数字健康工程学会) 评价时间:2023-10-10

刘秀玲

保定市知识产权协会

院长/理事长

综合评价

技术转让,所需资金需双方协商,此项技术想尽快落地保定,希望具备此项技术研发的技术方,能够尽快承接次项目
查看更多>
更多