您所在的位置: 成果库 企业级数据中心故障预测系统

企业级数据中心故障预测系统

发布时间: 2022-11-13

来源: 科技服务团

基本信息

合作方式: 合作开发
成果类型: 新技术
行业领域:
电子信息技术
成果介绍
随着大数据时代的到来,政府、企业已经逐渐从以业务应用为中心转变为以数据为中心的模式。数据中心成为最重要的基础设施。谷歌、百度、阿里巴巴等企业数据中心的服务器数量都在百万台以上。高昂的运营成本是数据中心面临的最大挑战之一。随之带来的问题是:各种类型的故障频发以及人为失误导致服务中断频发。如腾讯云数据丢失和阿里云半年来两次宕机事件等。在数据中心中,硬盘故障是主要的故障源,给系统的可靠性和可用性带来极大挑战。本项目借鉴医疗领域“预防胜于治疗”的思想,通过主动预测硬盘故障、提前进行处理,将存储系统传统的“被动容错”机制转变为“主动容错”,从根本上解决频发硬盘故障降低系统可靠性和可用性的问题。
成果亮点
本项目工作技术先进,1,利用BP-ANN、决策树、梯度提升树GBDT、循环神经网络RNN构建硬盘故障预测模型,与前人提出的方法相比,将故障检测率从60%左右提高到95%以上,将误报率降低到***%以下;2,提出适应主动容错思想的弹性副本+纠删码的混合冗余方案,提高数据可靠性;3,在SCI一区、二区期刊TDSC、TC,及相关顶尖会议MSST、DSN、SRDS 等发表论文十余篇。
团队介绍
南开大学是国内学科门类齐全的综合性、研究型大学之一,在长期办学过程中,形成了文理并重、基础宽厚、突出应用与创新的办学特色。学校有专业学院27个,学科门类覆盖文、史、哲、经、管、法、理、工、农、医、教、艺等。有国家“双一流”建设学科6个,一级学科国家重点学科6个(覆盖35个二级学科),二级学科国家重点学科9个,一级学科天津市重点学科32个。在第四轮全国学科评估中,14个学科进入前10%,其中5个学科进入前5%;在全球学科评价体系中,前1%学科15个,化学和材料科学进入前1‰。
成果资料
产业化落地方案
点击查看