随着工业4.0和工业物联网(IIoT)的发展,处理来自传感器的流式时间序列数据变得越来越重要。一个重要的应用场景就是给定一个时间序列片段,即模式,在流式到达的时间序列中实时地发现给定的模式。传统的时间序列模式匹配过于简单,无法满足一些实际场景中的需求。
本发明提供的一种多分段多阈值约束的时间序列模式查找方法和系统,通过设置多窗口块获取特征,能够对特征进行高效提取。并且,本发明提出了高效的后处理算法,可以高效的完成多阈值模式的精确比较,能够满足实际场景中的需求。通过设置等长分段表示法,能够有效地提升过滤效率,保证没有漏解。设置多子模式多阈值,定义了新的更细粒度的模式模型,可以更加精确地描述带匹配的模式。
本发明提供一种多分段多阈值约束的时间序列模式查找方法和系统,查找方法包括:将时间序列模式和滑动窗口分别划分成数目相等的窗口块,并且提取时间序列模式的指定个窗口块的特征,其中,时间序列模式由多个互不重叠的包括对应的预设阈值的子模式构成;获取滑动窗口在流式时序数据上滑动至任一窗口时,滑动窗口的指定个窗口块的特征;若判断获知任一窗口不能跳过,则从任一窗口开始,判断与滑动窗口的跳跃步长数相等的窗口块的流式时序数据和时间序列模式是否匹配,若匹配,则获取与滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果。
本项目的研究成果可运用于建立 Apache IoTDB 集群、分布式版本架构,有助于 IoTDB 更广泛的工业场景运用。目前,以 Apache IoTDB 为核心的物联网原生时序数据库管理系统已在国家电网、国家气象局、中航成飞、中核集团、长安汽车、金风科技等企业广泛应用。
天谋科技由 Apache IoTDB 核心团队创立,团队聚焦大数据底层技术软件研发,针对企业组建物联网大数据平台时所遇到的数据体量大、采样频率高、数据乱序到达、分析需求多、存储与运维成本高等多种问题,为企业提供海量时序数据管理的高效解决方案。创始团队由 Apache(国际最大开源软件基金会)旗下 IoTDB、PLC4X 两大开源物联网项目的发起人和核心开发者组成,汇集了来自清华大学、UC Berkeley、微软、德国弗劳恩霍夫协会(Fraunhofer-Gesellschaft)、德国法兰克福能源集团等一批数据库核心技术科学家和工业资深专家,拥有十几年研究和服务工业用户的经验。在时序数据管理领域,团队成员拥有中国、美国、欧洲等发明专利30余项,并在 ICDE, SIGMOD, VLDB 等数据库顶级会议上发表论文多篇。
近年来伴随物联网和工业互联网行业的发展,高效的物联网/工业物联网数据管理技术成为工业界的需求热点。针对工业场景中机器设备、传感器等终端上报的时序数据(按时间记录的数据列),时序数据库 Apache IoTDB 为更好的管理时序数据提供了出色的解决方案,能够帮助企业更好的挖掘时序数据价值。
技术由天谋科技(北京)有限公司的 IoTDB 核心团队研发,预计应用于各工业领域公司以 IoTDB 为主体的时序数据管理平台中。