您所在的位置: 成果库 图像识别方法和系统

图像识别方法和系统

成果类型:: 发明专利

发布时间: 2023-08-09 15:41:49

科技成果产业化落地方案
方案提交机构:天津市滨海新区| 宋学姮 | 2023-08-10 09:20:44
一种图像识别方法包括如下步骤:获取动态影像;提取所述动态影像中的多帧静态图像分别识别所述多帧静态图像中是否包含同一目标图像;在识别结果为包含所述目标图像的所述静态图像的数量达到预设数量阀值时,判定所述动态影像中包含所述目标图像。本发明还提供一种图像识别装置。上述图像识别方法和装置是通过多帧静态图像的成功识别的比例,判定动态影像中是否包含目标图像,这样便可以减小单帧图像误判带来的不良问题,提高系统稳定性。
1.一种图像识别方法,其特征在于,包括如下步骤: 步骤SlOl,获取动态影像; 步骤S102,提取所述动态影像中的多帧静态图像; 步骤S103,分别识别所述多帧静态图像中是否包含同一目标图像,在一帧所述静态图像中识别到两种所述目标图像时,当第一种目标图像的相似度超过第二种目标图像的相似度达到预设差值时,选择所述第一种目标图像作为该帧静态图像中的目标图像,反之选择所述第二种目标图像作为该帧静态图像中的目标图像; 步骤S104,在识别结果为包含所述目标图像的所述静态图像的数量达到预设数量阈值时,判定所述动态影像中包含所述目标图像; 步骤S201,提取所述静态图像中识别出的目标图像的坐标; 步骤S202,根据预设方式定义识别出的所述目标图像上某一点为基准点; 步骤S203,当相邻二帧所述静态图像中识别到的所述目标图像不同时,通过预设参数调整后一帧所述静态图像中识别到的所述目标图像的基准点位置; 步骤S204,记录所述多帧静态图像中所述目标图像的所述基准点的移动轨迹,生成所述目标图像的移动信息。

近年来,随着智能终端设备的普及,寻求一种更自然更简单的人机交互方式已然成为科研和产业领域的热点问题。纵观人机交互技术的发展历史,已逐渐从鼠标、键盘、遥控器等方式发展为视觉、语音、姿态等非接触式的操作方式,而且视觉技术作为其中最为重要的手段。随着3D技术的发展,微软推出了 Kinect系统,其通过动态三维重建技术,将人机交互由2D的图像空间拓展到真实的3D空间,3D空间的深度信息有效的解决了2D空间中较为复杂的背景分割问题,使得该技术趋于成熟,并已应用到电视机、游戏机等设备中,用做外置的人机交互设备。但这种基于3D技术的手势和姿态体感控制系统受限于其昂贵的硬件成本和巨大的运算量,以及其体积较大,很难集成到现有智能终端设备中。

[0003] 为了减少数据处理量,通常是通过摄像头获取2D画面,基于2D图像智能分析技术判断操作者的动作和意图,进而控制机器。但其所面临最大的问题是环境的复杂性和不确定性,使得图像识别准确性不高,误判较多,导致整个图像识别系统不稳定。

中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。团队成员在各自的专业领域具有深厚的研究背景和专业知识,通过推动前沿科技研究和创新驱动,推进中国的科技水平和国家竞争力。

本发明一较佳实施例中,所述识别判定单元是在所述多帧静态图像的头尾二帧所述静态图像和中间一帧所述静态图像识别到同一目标图像时,判定所述动态影像中包含所述目标图像。

[0020]上述图像识别方法和装置是通过多帧静态图像的成功识别的比例,判定动态影像中是否包含目标图像,这样便可以减小单帧图像误判带来的不良问题,提高系统稳定性。

技术合作

本发明一较佳实施例中,图像识别单元304进一步用于在一帧静态图像中识别到两种目标图像时,当第一种目标图像(拳头)的相似度超过第二种目标图像(手掌)的相似度达到预设差值时,选择第一种目标图像作为该帧静态图像中的目标图像。如:第一种目标图像的相似度大于三倍的第二种目标图像的相似度时,选择第一种目标图像作为该帧静态图像中的目标图像。以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。