一种计算资源感知的任务调度方法
成果类型:: 发明专利
发布时间: 2022-11-07 08:54:21
本发明公开了一种计算资源感知的任务调度方法,根据任务的应用类型属性对待处理任务进行分组,将各组中不同类型的任务按截止时间进行排序,将排序后的任务根据延迟需求对不同类型的任务进行分组打包得到多个任务块,对任务块的截止时间进行更新,将任务块放入执行队列后按截止时间进行升序排序得到基本调度方案;根据待处理任务属性和计算资源,对潜在的会错过截止时间的高优先级任务进行重新调度,在保证系统吞吐率和延迟的同时充分考虑各任务属性,对执行顺序进行调整,尽量避免任务错过截止时间,充分利用多核设备并行计算优势,采用细粒度的任务调度对计算资源进行灵活分配,确保高优先级的任务不会错过截止时间,得到了高效的任务调度结果。
深度学习技术广泛应用于图像识别、自然语言处理、推荐系统等领域。传统的冯诺依曼架构的通用处理器由于存储计算的分离而效率低下,这使得它很难满足深度学习应用不断增长的计算速度和能效需求。因此,许多高效的深度学习处理器架构被提出并广泛应用于深度学习应用的推理加速中。深度学习处理器等设备往往能够通过分批处理大量的深度学习推理任务来达到最佳的吞吐率,这些设备可以通过神经网络中权重参数的复用、向量矩阵等数值运算的优化、主机与设备间通信开销的优化等手段来提高设备的利用率,批量处理更加注重吞吐率,使得该模式在任务延迟上不具备优势。本发明要解决的技术问题在于克服现有技术中任务调度方法未全面考虑任务属性及计算资源情况对任务调度效果差的缺陷,从而提供一种计算资源感知的任务调度方法。
本发明提供的一种计算资源感知的任务调度方法,首先获取待处理任务对应的属性及任务执行的延迟需求,属性包括应用类型、任务到达时间、任务截止时间和任务的优先级根据任务的应用类型属性对待处理任务进行分组,将各组中不同类型的任务按截止时间进行排序,将排序后的任务根据延迟需求对不同类型的任务进行分组打包得到多个任务块,对任务块的截止时间进行更新,将任务块放入执行队列后按截止时间进行升序排序得到基本调度方案;根据待处理任务属性和计算资源,对潜在的会错过截止时间的高优先级任务进行重新调度,得到最终的调度方案。本发明实施例提供的方法,在保证系统吞吐率和延迟的同时充分考虑各任务属性,对执行顺序进行调整,尽量避免任务错过截止时间,充分利用多核设备并行计算优势,采用细粒度的任务调度对计算资源进行灵活分配,进一步确保高优先级的任务不会错过截止时间,得到了高效的任务调度结果。
深圳大学秉承“自立、自律、自强”的校训,紧随特区,锐意改革、快速发展,在较短的时间内形成了从学士、硕士到博士的完整人才培养体系以及多层次的科学研究和社会服务体系,形成了“特区大学、窗口大学、实验大学”的办学特色,培养了20多万各类创新创业人才,95%以上扎根粤港澳大湾区,为特区发展和国家现代化建设做出了重要贡献。特别是进入新时代以来,学校实施高水平大学建设发展战略,成为内地进步最快的大学之一,综合实力得到全面快速提升,实现了从本科教学型大学向教学科研并重型大学的转型,创新创业人才培养、人事管理体制等领域的改革走在全国前列。目前,学校已经成为一所特色鲜明、实力雄厚、在国内外具有良好声誉和重要影响力的高水平综合性大学。
本发明提供的一种计算方法很好地考虑不同任务的优先级和截止时间,是一种细粒度的任务调度方法,它考虑到利用多核处理设备的优势,对任务进行灵活地分配,进一步确保高优先级的任务不会错过截止时间。适用于 图像识别、自然语言处理、推荐系统等领域或其他涉及深度学习的方法。能够确保高优先级的任务不会错过截止时间,得到高效的任务调度结果。
技术许可:其他明确合理的许可使用费标准(开放许可期限内免费许可)