您所在的位置: 成果库 基于容器的监控方法、系统、设备及介质

基于容器的监控方法、系统、设备及介质

成果类型:: 发明专利

发布时间: 2023-09-27 21:52:53

科技成果产业化落地方案
方案提交机构:“科创中国”超级算力应用创新科技服务团| 李学智 | 2023-11-25 13:19:51

本发明涉及监控领域,公开了一种基于容器的监控方法、系统、设备及介质。监控方法包括:确定预设类型的主监控对象以及与所述主监控对象关联的监控部署信息;控制在所述主监控对象上搭建Kubernetes环境,并加载Helm管理服务,以通过Kubernetes管理工具根据所述监控部署信息从所述helm管理服务中确定对应的监控资源;控制所述监控资源中的监控容器安装至所述主监控对象,通过所述监控资源中的监控容器对运行在所述主监控对象上的子监控对象以及所述主监控对象本身进行监控。

一种基于容器的监控方法,应用于监控系统,包括如下步骤:确定预设类型的主监控对象以及与所述主监控对象关联的监控部署信息;控制在所述主监控对象上搭建Kubernetes环境,并加载Helm管理服务,以通过Kubernetes管理工具根据所述监控部署信息从所述Helm管理服务中确定对应的监控资源;针对不同的主监控对象,建立不同的Chart,每个Chart包含一个或多个监控容器,不同的监控容器内封装有针对不同子监控对象的监控软件,所述子监控对象在所述主监控对象上运行;所述监控资源中的监控容器来源于本地容器镜像仓库,所述本地容器镜像仓库中存储有针对不同的主监控对象以及针对不同的子监控对象的监控容器;通过所述监控资源中的监控容器对运行在所述主监控对象上的子监控对象以及所述主监控对象本身进行监控;其中,Helm管理服务是利用Helm搭建的一个Kubernetes的包管理器;Helm管理服务将每个主监控对象需要的多种监控软件的监控容器进行打包并进行统一管理。

随着互联网技术的迅猛发展,企业和开发者越来越依赖于大规模、高可用的分布式集群系统。为了确保这些系统的稳定性和高效性,对系统及其底层集群进行有效地监控和管理变得尤为重要。

对于复杂集群,监控各种不同类型的组件是有必要的。然而,传统监控系统(监控软件或者说是监控插件)可能缺乏与各种组件集成的能力,限制了其监控范围。传统监控系统只支持有限的插件和适配器,导致难以与各种不同的组件、框架和技术进行无缝集成,这导致监控覆盖范围受限。具体的,对于集群中不同操作系统的服务器,需要下载不同的监控插件进行安装。尤其是再加上服务器中部署了各种类型的数据库、中间件和应用软件等需要监控的对象,针对每一台服务器上的每一种需要监控的对象都要单独安装对应的监控插件,这将带来非常庞大的工作量。另外像部分安全设备(例如路由器、防火墙),厂商可能没有提供开放的API,限制了用户自定义集成的能力,这可能导致监控系统无法灵活地满足特定的需求和场景。而且,传统监控系统不具备自动发现新加入集群的组件或者设备(即需要监控的对象)的功能,这导致运维团队需要手动更新监控配置,增加了管理负担。

本成果能解决以上问题。

本专利由天津市天河计算机技术有限公司核心人员研发设计,成员包括冯景华、徐斌、刘迟、张志伟、杨满堂、韩道林、麻羽、朱明祖。天津市天河计算机技术有限公司,为国家超级计算天津中心的全资子公司,聚焦产品级技术研发和应用转化,为算力平台建设、管理、应用和人才培养创新企业。拥有国家最高等级(A级)高标准数据中心和地下人防数据中心,负责2010年世界最快超级计算机“天河一号”,及目前世界领先的天河新一代超级计算机系统的运行管理工作,在天河新一代超级计算机,算力系统构建、统一运维管理、融合算力服务平台和多领域行业平台方面具备自主核心技术,重点围绕算力技术创新方面开展核心技术突破和产品研发工作,打造国内领先的算力技术创新和专业服务企业,推动数字产业化和产业数字化发展,为数字中国发展助力。

本专利实现了快速在主监控对象上自动化部署对应监控软件的目的,提升了监控效率,降低了监控业务的相关工作量,当集群中有新的主监控对象加入时,也可较方便地针对新加入的主监控对象部署对应的监控软件,有利于监控业务的灵活扩展。即实现了对集群中各监控对象(主监控对象或者说是运行在主监控对象上的子监控对象)进行灵活监控,方便监控业务的扩展,监控覆盖范围较广且可灵活调整,监控管理与运维效率较高。

本成果拟通过技术开发等方式进行成果转化。