您所在的位置: 成果库 天河监控运维一体化平台

天河监控运维一体化平台

成果类型:: 软件著作权

发布时间: 2023-11-27 12:18:15

科技成果产业化落地方案
方案提交机构:成果发布人| 李学智 | 2023-11-27 12:18:15

该成果由天津市天河计算机技术有限公司开发设计完成。针对天河系列超级计算机系统,设计开发了天河监控运维一体化平台,包括登录系统模块、报警管理模块、配置文件管理、实例管理、群组管理、节点管理、脚本管理、客户端管理等,实现超级计算机系统监控运维的流程化、规范化。

根据监控产品化需求,采取前端定制化,后端统一化的策略。自动化配置管理prometheus监控客户端,使监控运维变得更加方便简单易用。

该成果可应用于超级计算机系统、数据中心机房的系统和基础设施的监控运维,并可针对具体监控运维需求进行定制化开发,应用前景广阔。

天津市天河计算机技术有限公司为国家超级计算天津中心的全资子公司,聚焦产品级技术研发和应用转化,为算力平台建设、管理、应用和人才培养创新企业。拥有国家最高等级(A级)高标准数据中心和地下人防数据中心,负责2010年世界最快超级计算机“天河一号”,及目前世界领先的天河新一代超级计算机系统的运行管理工作,在天河新一代超级计算机,算力系统构建、统一运维管理、融合算力服务平台和多领域行业平台方面具备自主核心技术,重点围绕算力技术创新方面开展核心技术突破和产品研发工作,打造国内领先的算力技术创新和专业服务企业,推动数字产业化和产业数字化发展,为数字中国发展助力。

开发超级计算机系统监控运维一体化平台,使得系统监控及运维人员对相关问题处理过程实现流程化、规范化,同时对于风险可控的问题处理实现自动化,减小人为误操作的风险,极大地提升了超级计算机系统监控运维效率。

该成果拟通过技术开发、技术许可等方式进行成果转化。