您所在的位置: 成果库 企业级数据中心故障预测系统

企业级数据中心故障预测系统

成果类型:: 新技术

发布时间: 2022-11-13 12:34:20

科技成果产业化落地方案
方案提交机构:成果发布人| 周达 | 2022-11-13 12:34:20

随着大数据时代的到来,政府、企业已经逐渐从以业务应用为中心转变为以数据为中心的模式。数据中心成为最重要的基础设施。谷歌、百度、阿里巴巴等企业数据中心的服务器数量都在百万台以上。高昂的运营成本是数据中心面临的最大挑战之一。随之带来的问题是:各种类型的故障频发以及人为失误导致服务中断频发。如腾讯云数据丢失和阿里云半年来两次宕机事件等。在数据中心中,硬盘故障是主要的故障源,给系统的可靠性和可用性带来极大挑战。本项目借鉴医疗领域“预防胜于治疗”的思想,通过主动预测硬盘故障、提前进行处理,将存储系统传统的“被动容错”机制转变为“主动容错”,从根本上解决频发硬盘故障降低系统可靠性和可用性的问题。

本项目工作技术先进,1,利用BP-ANN、决策树、梯度提升树GBDT、循环神经网络RNN构建硬盘故障预测模型,与前人提出的方法相比,将故障检测率从60%左右提高到95%以上,将误报率降低到0.01%以下;2,提出适应主动容错思想的弹性副本+纠删码的混合冗余方案,提高数据可靠性;3,在SCI一区、二区期刊TDSC、TC,及相关顶尖会议MSST、DSN、SRDS 等发表论文十余篇。

本项目成果可以广泛应用于互联网、电信、电力、金融等行业内,具有大量服务器的企业级数据中心,提高数据中心的可靠性。

南开大学是国内学科门类齐全的综合性、研究型大学之一,在长期办学过程中,形成了文理并重、基础宽厚、突出应用与创新的办学特色。学校有专业学院27个,学科门类覆盖文、史、哲、经、管、法、理、工、农、医、教、艺等。有国家“双一流”建设学科6个,一级学科国家重点学科6个(覆盖35个二级学科),二级学科国家重点学科9个,一级学科天津市重点学科32个。在第四轮全国学科评估中,14个学科进入前10%,其中5个学科进入前5%;在全球学科评价体系中,前1%学科15个,化学和材料科学进入前1‰。

目前项目已与百度、奇虎360、华为等公司展开硬盘故障预测方法的研究,一些成果已应用于实际系统,取得了良好的效益。

项目技术已经比较成熟,可以根据行业和企业实际情况,定制相应解决方案。