您所在的位置: 成果库 图像分类的方法及装置

图像分类的方法及装置

成果类型:: 发明专利

发布时间: 2023-07-01 11:48:21

科技成果产业化落地方案
方案提交机构:天津市滨海新区| 宋学姮 | 2023-07-21 15:21:32
本发明适用于计算机视觉技术领域,提供了一种图像分类的方法及装置。该方法包括:通过深度卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征;对提取的所述中间卷积层的特征进行预处理,并对预处理后的中间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取的全连接层的特征进行归一化处理后作为图像表示的高层语义特征;将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合;基于融合后的特征进行图像分类。通过本发明,可有效提高图像内容识别的准确率,进而提高图像分类的准确率。
一种图像分类的方法,其特征在于,所述方法包括:通过卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征;对提取的所述中间卷积层的特征以及全连接层的特征进行预处理,并对预处理后的中间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取的全连接层的特征进行归一化处理后作为图像表示的高层语义特征;将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合;基于融合后的特征进行图像分类。

图像分类技术是指通过计算机算法判断图像内容如物体、场景等所属的类别。而图像分类技术中图像的特征表示将直接影响最终的判断结果。随着深度学习的发展,使用大量数据训练的卷积神经网络模型成为主要的图像分类技术,该技术利用卷积神经网络中的全连接层作为图像的特征表示,然后利用SoftMax等分类器进行分类,在实际应用中取得了较好的效果。

然而,全连接层的图像特征表示的是图像的高层语义特征,主要描述图像的整体布局。但在许多图像中,例如:卧室和客厅,整体布局相同,但是客厅一般只放沙发,卧室只放床。而这些物体上的差异信息高层语义特征往往无法表述,影响了图像分类的准确率。

中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。

本发明实施例与现有技术相比存在的有益效果是:本发明实施例通过卷积神经网络提取输入图像的中间卷积层的特征,对提取的所述中间卷积层的特征进行预处理后编码成图像表示的中层语义特征,并将所述图像表示的中层语义特征和图像表示的高层语义特征进行融合,通过融合后的混合特征来表示图像信息,由于融合后的混合特征不仅能够体现图像的高层全局语义特征而且也能很好的体现图像的细节和局部信息,因此效果相比单一的全连接层特征有明显提高,可有效提高图像内容识别的准确率,进而提高图像分类的准确率,具有较强的易用性和实用性。

技术合作

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范围。