您所在的位置: 成果库 分布式计算机存储系统中数据副本异构存储与访问方法

分布式计算机存储系统中数据副本异构存储与访问方法

成果类型:: 发明专利

发布时间: 2022-11-17 22:35:13

科技成果产业化落地方案
方案提交机构:“科创中国”开源产业科技服务团| 李以华 | 2022-12-07 14:30:12
工业领域需要处理的数据通常具有多个属性,在分布式计算机存储系统中,为了提高系统的性能以及可用性,将数据以多副本的形式进行存储已成为一种共识。对于时间序列数据,除处理针对时间的访问可以快速找到对应数据段,其他属性的访问需要对全部数据进行遍历。多副本技术仅仅提升了系统可用性,并没有提升分布式计算机存储系统在不同属性上的访问速度。 本发明将不同数据副本按照用户访问特点按不同属性排序存储,从而使分布式计算机存储系统中数据的多个数据副本能够快速响应用户在数据不同属性上的访问请求,使得多副本技术在提高系统可用性的基础上,还提升了系统的访问性能。
本发明涉及一种分布式计算机存储系统中数据副本异构存储与访问方法,属于计算机数据管理技术领域。首先根据用户指定的属性优先级和数据副本数n进行属性分配,每个数据副本对应一个存储特征,并根据存储特征创建各个数据副本的存储模型,随后将数据写入到n个数据副本中;在访问请求到来时,解析访问条件,生成访问属性集,计算各个数据副本的访问优先级,找出最佳访问数据副本进行访问。

本项目的研究成果可运用于建立 Apache IoTDB 集群、分布式版本架构,有助于 IoTDB 更广泛的工业场景运用。目前,以 Apache IoTDB 为核心的物联网原生时序数据库管理系统已在国家电网、国家气象局、中航成飞、中核集团、长安汽车、金风科技等企业广泛应用。

天谋科技由 Apache IoTDB 核心团队创立,团队聚焦大数据底层技术软件研发,针对企业组建物联网大数据平台时所遇到的数据体量大、采样频率高、数据乱序到达、分析需求多、存储与运维成本高等多种问题,为企业提供海量时序数据管理的高效解决方案。创始团队由 Apache(国际最大开源软件基金会)旗下 IoTDB、PLC4X 两大开源物联网项目的发起人和核心开发者组成,汇集了来自清华大学、UC Berkeley、微软、德国弗劳恩霍夫协会(Fraunhofer-Gesellschaft)、德国法兰克福能源集团等一批数据库核心技术科学家和工业资深专家,拥有十几年研究和服务工业用户的经验。在时序数据管理领域,团队成员拥有中国、美国、欧洲等发明专利30余项,并在 ICDE, SIGMOD, VLDB 等数据库顶级会议上发表论文多篇。

近年来伴随物联网和工业互联网行业的发展,高效的物联网/工业物联网数据管理技术成为工业界的需求热点。针对工业场景中机器设备、传感器等终端上报的时序数据(按时间记录的数据列),时序数据库 Apache IoTDB 为更好的管理时序数据提供了出色的解决方案,能够帮助企业更好的挖掘时序数据价值。

技术由天谋科技(北京)有限公司的 IoTDB 核心团队研发,预计应用于各工业领域公司以 IoTDB 为主体的时序数据管理平台中。目前公司资金充足,可以单独完成成果研发,并在开源社区积极寻求开源用户体验、优化产品。希望未来能够在更多行业更多企业运用至时序数据管理平台。