成果介绍
物联网(IoT)尤其是工业物联网(IIoT 与Industry ***)的发展进一步激发了时序数据管理技术的市场需求,使其进而成为该领域重要的软件基础设施。 随着工业物联网的发展,对机器设备产生数据的管理成为工业生产提质增效、精益求精的重要手段。但工业机器设备所产生的数据具有产生频率快、严重依赖采集时间、测点多、信息量大等特点,传统数据库难以实现对时间序列数据的有效存储、处理和查询,因此时序数据库管理的需求被迅速点燃。
成果亮点
提供一种数据异常检测方法和装置,能对区块链第三方存储介质上时序数据在线做异常检测的高效算法。所述方法包括:对各数据集按照属性进行去一划分,并根据划分后的数据集的信息熵计算各属性的权值;根据各属性的权值计算各数据集中不同数据对象间的余弦距离,并根据各数据对象与其他数据对象间的余弦距离计算各数据对象的初始异常值;对计算好所有数据对象的初始异常值的各数据集按照时序插入有序序列;根据序列中任一数据集的上一时刻和下一时刻的数据集的异常状态更新所述任一数据集的数据对象的初始异常值;对各数据集的数据进行检测,对异常值超过指定阈值的数据判断为异常
团队介绍
清华大数据软件团队- IoTDB 组,团队聚焦大数据底层技术软件研发,针对企业组建物联网大数据平台时所遇到的数据体量大、采样频率高、数据乱序到达、分析需求多、存储与运维成本高等多种问题,为企业提供海量时序数据管理的高效解决方案。该项成果可运用于物联网领域处理工业场景中的时序数据。 创始团队由 Apache(国际最大开源软件基金会)旗下 IoTDB、PLC4X 两大开源物联网项目的发起人和核心开发者组成,汇集了来自清华大学、UC Berkeley、微软、德国弗劳恩霍夫协会(Fraunhofer-Gesellschaft)、德国法兰克福能源集团等一批数据库核心技术科学家和工业资深专家,拥有十几年研究和服务工业用户的经验。在时序数据管理领域,团队成员拥有中国、美国、欧洲等发明专利30余项,并在 ICDE, SIGMOD, VLDB 等数据库顶级会议上发表论文多篇。
成果资料