您所在的位置: 成果库 一种硬盘设备的剩余使用寿命在线预测方法和系统

一种硬盘设备的剩余使用寿命在线预测方法和系统

成果类型:: 发明专利

发布时间: 2023-10-16 16:08:09

科技成果产业化落地方案
方案提交机构:成果发布人| 王正伦 | 2023-10-16 16:08:09

一种硬盘设备的剩余使用寿命在线预测方法,其特征在于,该方法包括以下步骤:S1.定期从数据中心采集硬盘设备的SMART信息和I/O状态信息并存储为历史状态数据集和实时状态数据集,所述I/O状态信息包含I/O请求在硬盘设备上所消耗的D2C时间;S2.通过特征工程,将历史状态数据集转换为双向长短时记忆神经网络接受的数据对类型的数据集;S3.将转换后的数据集作为双向长短时记忆神经网络的输入,训练得到硬盘剩余使用寿命的预测模型;S4.通过特征工程,将实时状态数据集转换为双向长短时记忆神经网络接受的数据对类型的数据集;S5.将转换后的数据集作为训练好的硬盘剩余使用寿命的预测模型的输入,得到硬盘剩余使用寿命预测值。

本发明公开了一种硬盘设备的剩余使用寿命在线预测方法和系统,属于计算机存储技术领域。本发明以硬盘设备的SMART信息和I/O状态信息为依据,进行硬盘设备的剩余使用寿命在线预测,SMART数据记录了多项硬盘运行状态的可靠性指标,I/O状态信息包含I/O请求在硬盘设备上所消耗的时间,去掉了对硬盘设备寿命无关的时间;基于采集到的I/O状态信息,生成若干衍生变量属性,这些衍生变量与硬盘寿命强相关,反映了硬盘状态信息与故障的内在关系;采用分组标签赋值,避免使用变化较大的临时变量影响训练效果,并选用双向长短时记忆神经网络作为预测模型,结合前后隐藏层对当前值做出合理预测,均方根误差和平均绝对误差均得到了有效降低,从而提高硬盘寿命预测的精度。

近年来,越来越多的软件应用程序选择作为在线服务部署在诸如微软、谷歌、亚马逊等云计算平台上。尽管大多数云服务提供厂商都宣称提供高可用性,但实际上云服务依然会失败从而导致用户不满意和经济损失。造成系统服务不可用的原因主要包括:操作失误、病毒破坏、硬件系统故障或软件故障(内存错误、网络故障灯)、设备硬件故障等几方面。相比如CPU、内存等其他部件,而且硬盘具有体量大,剩余使用寿命短等特点,是存储设备硬件故障的主要部分。提高硬盘可靠性在数据中心中显得尤为重要。

为提高云平台的可靠性,目前采用的技术主要分为被动容错和主动容错技术。被动容错主要包括纠删码、备份等。主动容错包括常规性维护和预测性维护两种。常规性维护主要包括周期性维护(定期检查,例如硬盘自带的SMART阈值监测)和故障时维护(运维检测到硬盘无法读写后进行数据恢复)。预测性维护主要通过机器学习的方法进行建模预测,目前主要将其作为二分类的问题,即判断硬盘是否故障。

华中科技大学(Huazhong University of Science and Technology),简称华中大、华科大 ,位于湖北省武汉市,是中华人民共和国教育部直属的综合性研究型全国重点大学、位列国家“双一流”“985工程”“211工程”、入选“强基计划”“111计划”、卓越工程师教育培养计划、卓越医生教育培养计划、国家大学生创新性实验计划、国家级大学生创新创业训练计划、国家建设高水平大学公派研究生项目、国家级新工科研究与实践项目、基础学科拔尖学生培养计划2.0,是学位授权自主审核单位、全国深化创新创业教育改革示范高校、一流网络安全学院建设示范项目高校、中国政府奖学金来华留学生接收院校、教育部来华留学示范基地,为中欧工程教育平台成员和医学“双一流”建设联盟 、国际应用科技开发协作网 、全球能源互联网大学联盟成员。

1.本发明以硬盘设备的SMART信息和I/O状态信息为依据,进行硬盘设备的剩余使用寿命在线预测,SMART数据记录了多项硬盘运行状态的可靠性指标,所述I/O状态信息包含I/O请求在硬盘设备上所消耗的时间,去掉了与硬盘设备寿命无关的时间,因此,能够提高硬盘寿命预测的准确率。

2.本发明基于采集到的I/O状态信息,生成若干衍生变量属性,这些衍生变量与硬盘寿命强相关,反映了硬盘状态信息与故障的内在关系,能够有效提高硬盘寿命预测的精度。

3.本发明采用分组标签赋值,避免使用变化较大的临时变量RULi,t影响训练效果,并选用双向长短时记忆神经网络作为预测模型,前向隐藏层考虑了历史值对当前值的影响,后向隐藏层考虑了未来值对当前值的影响,结合前后隐藏层对当前值做出合理预测,克服了RNN梯度消失和爆炸的问题,均方根误差和平均绝对误差均得到了有效降低,从而提高硬盘寿命预测的精度。

本专利成果采用技术转让,技术入股,技术合作等成果转化方式,希望进一步实现该专利的有益效果,有兴趣皆可面议。