本发明适用于信息技术领域,提供了一种图像检索的方法及装置,包括:获取每张样本图片的第一描述子和输入图片的第二描述子;将所述第一描述子和所述第二描述子分别由Fisher向量形式转换成只包含“0”和“1”的向量形式;分别计算转换后的所述第二描述子与每个转换后的所述第一描述子的相似度,根据计算结果对所述样本图片进行筛选,得到所述输入图片的检索结果。本发明将图片的描述子由Fisher向量转换为只包含元素“0”和元素“1”的向量,以在进行向量内积运算之前对图片进行初步筛选,减少了进行向量内积运算的样本图片数量,从而在大规模的图片检索系统中大大地提升了图像检索的运算速度,提高了检索效率。
一种图像检索的方法,其特征在于,包括:获取每张样本图片的第一描述子和输入图片的第二描述子;将所述第一描述子和所述第二描述子分别由Fisher向量形式转换成只包含“0”和“1”的向量形式;分别计算转换后的所述第二描述子与每个转换后的所述第一描述子的相似度,根据计算结果对所述样本图片进行筛选,得到所述输入图片的检索结果;所述将所述第一描述子和所述第二描述子分别由Fisher向量形式转换成只包含“0”和“1”的向量形式包括:将所述Fisher向量中大于或等于0的元素置1,并将所述Fisher向量中小于0的元素置0,得到每张所述样本图片的第三描述子和所述输入图片的第四描述子;将所述Fisher向量等分成M份,所述M为大于1的整数;对每一份所述Fisher向量取均值;若所述均值大于或等于0,则在该均值所在位置置1,若所述均值小于0,则在该均值所在位置置0,得到每张所述样本图片的第五描述子和所述输入图片的第六描述子
随着数字技术、传感技术和网络技术的飞速发展,图片的数量越来越多,内容也越来越丰富,基于内容的图像检索方式开始发展起来,由最初的基于颜色信息和形状信息生成描述子以进行检索,发展到基于BOW(bag of words)模型进行检索,通过特征点提取,并对提取的特征点进行聚类后生成直方图,以作为每幅图片的描述子,用于进行相似度匹配,完成图像检索。
基于BOW模型,现有技术利用高斯混合模型(Gaussian Mixture Model,GMM)产生Fisher向量形式的描述子,然而,随着图片数量的增加,为了不影响检索的精度,生成Fisher向量所要用到的高斯模型的个数也需要增加,导致最后Fisher向量的维度是线性增长的,从而影响了图像检索的效率。
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
用于分别计算转换后的所述第二描述子与每个转换后的所述第一描述子的相似度,根据计算结果对所述样本图片进行筛选,得到所述输入图片的检索结果。
本发明实施例将图片的描述子由Fisher向量转换为只包含元素“0”和元素“1”的向量,以在进行向量内积运算之前对图片进行初步筛选,减少了进行向量内积运算的样本图片数量,从而在大规模的图片检索系统中大大地提升了图像检索的运算速度,提高了检索效率。
技术合作
所述检索单元43包括:
第一过滤子单元,分别计算所述输入图片的第六描述子与每张所述样本图片的第五描述子的第一相似度,对所述第一相似度低的所述样本图片进行过滤。
第二过滤子单元,分别计算所述输入图片的第四描述子与过滤后的每张所述样本图片的第三描述子的第二相似度,对所述第二相似度低的所述样本图片进行再次过滤。
第三过滤子单元,分别对所述输入图片的第二描述子与再次过滤后的每张所述样本图片的第一描述子做向量内积,得到所述输入图片匹配检索结果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。