流式RDF数据并行推理算法
发布时间: 2021-11-02
来源: 科技服务团
基本信息
本发明提出的流式并行推理主要分为构建伪双向网络、流式数据归类和OWL Horst规则的推理三个部分。根据Spark Streaming及Redis的特点,结合HAL算法和OWL Horst规则以及RDF数据本体,构建规则的伪双向网络,其中包含模式三元组对应的类节点和规则节点,若规则节点中存在类的连接变量则建立中间节点;接着,定时获取Streaming数据流中的批量新数据以及前次推理产生的数据作为输入数据,对输入的数据进行归类或新建对应节点并存储到相应的Redis集群;然后,对于输入的三元组数据结合伪双向网络判断对应的中间节点或者规则节点所监听的前件是否全部满足,进而对该规则进行推理,产生推理数据。最后,通过实时地删除重复推理数据并本次推理产生的所有数据保存到Redis集群中作为下次推理的输入数据,从而完整高效地实现RDF数据OWL Horst规则的并行流式推理。