以图搜图技术
预算 双方协商
基本信息
地区: 上海市 市辖区 杨浦区
需求方: 上海***公司
行业领域
新兴行业
需求描述
用户通过上传图片或输入图片的url地址,从而搜索到互联网上与这张图片相似的其他图片资源,同时也能找到这张图片相关的信息。
购物搜索引擎也是通过上传图片或输入图片的url地址,搜索到全网同款和相似的商品。
工作原理编辑
图像搜索引擎需要为在Web上浏览过的图像建立索引信息,能够进行图像分析和判别,为图像加注释,存储抽取出的索引信息建立索引库,理想的图像搜索引擎还应该能支持基于内容的图像检索。
图像识别方法
1、自动查找图形文:可以通过两个HTML标签,即IMG SRC和HREF来检测是否存在可显示的图像文件,IMG SRC表示“显示下面的图像文件”,而HREF则表示“下面是一个链接”,这两种标签经常导向一个图像文件。搜索引擎通过检查文件扩展名来判断链接的是否是图像文件。如果文件扩展名是.GIF或.JPG,那它就是一个可显示的图像。
2、人工干预找出图像并进行分类:即人工对网上的图像及站点进行选择。这种方法可以产生准确的查询体系,但劳动强度太大,限制了处理图像的数量。由于图像不同于文本,需要人们按照各自的理解来说明其蕴含的意义,因此图像检索比起文本的查询和匹配要困难得多。图像搜索引擎大多支持关键词检索和分类浏览两种检索方式,部分可提供可视属性检索,但也很有限。它们主要的检索途径有以下几种:
a. 基于图像外部信息:即根据图像的文件名或目录名、路径名、链路、ALT标签以及图像周围的文本信息等外部信息进行检索,这是图像搜索引擎采用最多的方法。在找出图像文件后,图像搜索引擎通过查看文件名或路径名确定文件内容,但这取决于文件名或路径名的描述程度。
b. 基于图像内容特征描述:这是一种语义层次的匹配。需要人工对图像的内容(如物体、背景、构成、颜色特征等)进行描述并分类,给出描述词。检索时,将主要在这些描述词中搜索你的检索词。这种查询方式是比较准确的,一般来讲可以获得较好的查准率。但需人工参与,劳动强度大,因而限制了可处理的图像数量,并且需要一定的规范和标准,效果取决于人工描述的精确度。
c. 基于图像形式特征的抽取:由图像分析软件自动抽取图像的颜色、形状、纹理等特征,建立特征索引库,用户只需将要查找的图像的大致特征描述出来,就可以找出与之具有相近特征的图像。这是一种基于图像特征层次的机械匹配,特别适用于检索目标明确的查询要求(例如对商标的检索)。产生的结果也是最接近用户要求的。但这种较成熟的检索技术主要应用于图像数据库的检索,在网上图像搜索引擎中应用这种检索技术还具有一定的困难。
相关技术编辑
从广义上讲,图像的特征包括基于文本的特征(如关键字、注释等)和视觉特征(如颜色、纹理、形状等)两类。视觉特征又可分为通用的视觉特征和领域相关(局部/专用)的视觉特征。前者用于描述所有图像共有的特征,与图像的具体类型或内容无关,主要包括颜色、纹理和形状;后者则建立在对所描述图像内容的某些先验知识(或假设)的基础上,与具体的应用紧密有关,例如人的面部特征或指纹特征等。
1、基于上下文本(context)的图片搜索
通常是通过Alt等锚来索引,搜索的,您可以访问搜索引擎,比如百度、GOOGLE。在搜索框内输入搜索文字,点击右侧的“图片搜索”按纽,即可获得相关图片搜索结果。
2、基于图片内容的搜索
涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科,其相关技术主要包括:图像数据模型、特征提取方法、索引结构、相似性度量、查询表达模式、检索方法等。相似图片的检测主要涉及特征表示和相似性度量这两类关键技术。图像特征的提取与表达是基于内容的图像处理技术的基础。
搜图引擎编辑
涌现很多以图搜图的搜索引擎,包括百度的识图搜索,安图搜的购物搜索引擎,Google的以图搜图,淘宝也推出以图搜图了等等。
搜图应用编辑
以图搜图已成为一种新的搜索趋势; 各大搜索引擎厂商均推出了使用图片搜索的功能,以图搜图主要应用在以下两方面:
1、同款比价购物搜索引擎:全球使用这种方式的网站有:安图搜,用户可以通过上传图片进行全网同款或者相似商品的搜索和比价。
2、图片搜索:国内有百度识图、搜狗、谷歌等网站,用户通过上传图片进行全网同图片或者相似图片的搜索。
处理进度