本发明公开了一种基于映射归约的分布式数据处理方法,其步骤包括:1、对磁盘中的数据进行分片处理,2、在所设置的缓冲区内部,对第一步的处理结果再次进行数据处理,3、通过循环处理,对来自不同磁盘的数据进行规约。本发明通过对磁盘进行分片处理,对磁盘内部数据进行两次排序与合并,从而使得磁盘内部的数据通过映射规约能够有序地排列,高效查询,进而能够降低大规模数据处理时的工作量,提升运行效率。
本发明是为了解决上述现有技术存在的不足之处,提出一种低硬件要求且具有高处理效率的基于映射归约的分布式数据处理方法,以期能通过对磁盘进行分片处理,对磁盘内部数据进行两次排序与合并,从而使得磁盘内部的数据通过映射规约能够有序地排列,高效查询,进而能够降低大规模数据处理时的工作量,提升计算机硬件运行效率。
此技术是合肥工业大学李磊研发,合肥工业大学是中华人民共和国教育部直属全国重点大学,教育部、工信部和安徽省政府共建高校,教育部与国防科工局共建高校。培养高等学历工业人才,促进科技文化发展。 经济学类、教育学类、文学类、理学类、工学类学科高等专科、本科、研究生班和硕士研究生学历教育 理学类和工学类学科博士研究生学历教育 博士后培养 相关科学研究、技术开发、继续教育、专业培训、学术交流与咨询服务
评价单位:- (-)
评价时间:2024-01-17
综合评价
技术转让,所需资金需双方协商,此项技术想尽快落地保定,希望具备此项技术研发的技术方,能够尽快承接次项目。
查看更多>