您所在的位置: 成果库 超级计算机资源调度方法、电子设备和介质

超级计算机资源调度方法、电子设备和介质

成果类型:: 发明专利

发布时间: 2023-09-27 12:42:19

科技成果产业化落地方案
方案提交机构:“科创中国”超级算力应用创新科技服务团| 李学智 | 2023-11-25 20:57:04

本发明涉及一种超级计算机资源调度方法、电子设备和介质,方法包括步骤S1、获取超级计算机第t时刻空闲节点数N1t、分配节点数N2t,第t+1时刻预留节点数NRt+1;步骤S2、若NRt+1大于N1t+N2t,且NRt+1‑(N1t+N2t)大于目标层级的交换机所管理的节点数量,则根据多层拓扑结构开启NRt+1‑(N1t+N2t)个节点,否则,执行步骤S3、获取第t+1时刻空闲节点数N1t+1、分配节点数N2t+1,第t+2时刻预留节点数NRt+2,若NRt+2大于NRt+1,且N1t+1+N2t+1小于NRt+2时,则不执行开启节点或关闭节点操作;若NRt+2大于NRt+1,且N1t+1+N2t+1大于等于NRt+2时,或者,NRt+2小于等于NRt+1时,则基于N1t+1、N2t+1、NRt+1和NRt+2确定关闭节点的数量NO,关闭NO个空闲节点。

一种超级计算机资源调度方法,包括:步骤S1、获取超级计算机第t时刻空闲节点数N1t、第t时刻分配节点数N2t、第t+1时刻预留节点数NRt+1;步骤S2、若NRt+1大于N1t+N2t,且NRt+1‑(N1t+N2t)大于目标层级的交换机所管理的节点数量,所述目标层级为预设的多层拓扑结构的预设的一个层级,则根据所述多层拓扑结构开启NRt+1‑(N1t+N2t)个节点,否则,执行步骤S3;步骤S3、获取第t+1时刻空闲节点数N1t+1、第t+1时刻分配节点数N2t+1、第t+2时刻预留节点数NRt+2,若NRt+2大于NRt+1,且N1t+1+N2t+1小于NRt+2时,则不执行开启节点或关闭节点操作;若NRt+2大于NRt+1,且N1t+1+N2t+1大于等于NRt+2时,或者,NRt+2小于等于NRt+1时,则基于N1t+1、N2t+1、NRt+1和NRt+2确定关闭节点的数量NO,关闭NO个空闲节点。

信息技术的快速发展与应用需求的驱动使得超级计算机不断发展,超级计算机带来巨大计算红利的同时,为满足超级计算机计算能力所需要的集群规模而造成的能源消耗,给超算计算机的运营带来了剧增的成本,加大了运营压力。因此,设置合理的资源调度策略来实现超级计算机的节能尤为重要。

现有技术中,对于超级计算机的节能策略主要有以下几类:利用附加设备进行储能或能源再利用;对支持超级计算机的基础设备(例如冷机、行间空调等)进行能耗管理;通过优化计算系统资源调度策略达到节能的目的。但是,现有技术并不能实现对超级计算机全系统的资源调度,无法很好的提升系统资源利用率,降低不必要的能耗。

本发明由国家超级计算天津中心核心团队研究开发完成,成员包括李宇奇、徐斌、张健、谭昕雨、冯景华。国家超级计算天津中心是2009年5月批准成立的首家国家级超级计算中心,部署有2010年11月世界超级计算机TOP500排名第一的“天河一号”超级计算机和“天河三号”原型机系统,构建有超算中心、云计算中心、电子政务中心、大数据和人工智能研发环境,是我国目前应用范围最广、研发能力最强的超级计算中心,为全国的科研院所、大学、重点企业提供了广泛的高性能计算、云计算、大数据、人工智能等高端信息技术服务。

本发明无需人工干预,自动对超级计算机进行计算容量优化,通过实时扩容或缩容超级计算机的计算容量,提高超级计算机的资源利用率,降低能耗。

该成果拟通过技术开发、技术许可等方式进行转化。