本发明公开了一种基于EMD距离的大规模图像数据相似性搜索方法,步骤包括:设计用于映射至一维实数键值空间Ω(Φ)的图像数据映射函数f;启动作业MR1,估计Ω(Φ)中各键值的负载;启动作业MR2,通过Map任务基于所估计的键值负载对Ω(Φ)进行切割,将切割区域对应的数据分片发送给Reduce任务;基于f将各Reduce任务接收的图像数据映射至Ω(Φ)中的键值,基于该键值构建面向EMD距离的索引结构;基于该索引结构执行基于EMD距离的相似性搜索;将MR2中各Reduce任务基于EMD距离相似性搜索的执行结果取并集输出。本发明具有网络传输数据量更低、计算负载分配更均衡,相似性搜索效率更高、对大数据集分析处理可扩展性更好的优点。
针对现有技术的上述技术问题,提供一种网络传输 数据更低、计算负载分配更均衡,相似性搜索效率更高、对大数据集分析处理具有可扩展性 更好的基于EMD距离的大规模图像数据相似性搜索方法。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于EMD距离的大规模图像数据相似性搜索方法,步骤包括:
1)设计用于将图像数据映射至一维实数键值空间Ω(Φ)的图像数据映射函数f, 所述图像数据映射函数f包含图像数据和一维实数键值空间Ω(Φ)中键值之间的映射关 系;
2)启动一个MapReduce作业MR1,通过MapReduce作业MR1基于查询图像集Q和待检 索图像集I估计所述一维实数键值空间Ω(Φ)中各个键值所对应的查询处理负载量;
3)启动一个MapReduce作业MR2,通过MapReduce作业MR2的Map任务基于所述步骤 2)估计得到的查询处理负载量对一维实数键值空间Ω(Φ)进行切割,分别将所述一维实数 键值空间Ω(Φ)不同切割区域所对应的查询图像集Q中的图像数据分片或待检索图像集I 中的图像数据分片发送给MapReduce作业MR2中的各个Reduce任务;
广西师范大学地处世界级旅游城市、国家历史文化名城桂林,是国家教育部与广西壮族自治区人民政府共建高校,“中西部高校基础能力建设工程项目”高校,广西重点建设的“国内一流大学”高校,全国文明校园。有王城、育才、雁山3个校区,校园面积4100多亩,各类学生50000多人,各类教职工4000多人(含离退休人员)。学校已发展成为广西教师教育的“领头羊”、人文强桂的“主力军”、科技兴桂的“生力军”、广西国际教育的“排头兵”。目前,学校正全力推进“双一流”建设和综合改革,努力实现建设国际知名、教师教育特色鲜明的国内一流大学的目标。
评价单位:- (-)
评价时间:2023-11-24
综合评价
技术转让,所需资金需双方协商,此项技术想尽快落地保定,希望具备此项技术研发的技术方,能够尽快承接次项目。
查看更多>