结合Spark平台的OWLHorst规则分布式并行推理算法
发布时间: 2021-11-02
来源: 科技服务团
基本信息
本发明提供一种结合Spark平台的OWLHorst规则分布式并行推理算法:根据Spark RDD的特点,结合TREAT算法的原理,首先对RDF本体数据进行构建模式三元组对应的alpha寄存器Om_RDD或Pt_RDD并广播以及规则标记模型;对每条规则的模式前件进行连接并生成对应的连接模式三元组集合Rulem_linkvar_RDD,从而加快推理过程中的匹配速度;在OWL Horst推理阶段,结合MapReduce实现TREAT算法中的alpha阶段,实现多条规则的分布式并行推理,然后对推理结果进行去重处理;通过alpha寄存器和规则标记模型能够过滤大量实例三元组,减少Map阶段键值对的输出,从而减少了无效的网络传输。