您所在的位置: 成果库 一种智能音频辨识系统及辨识方法

一种智能音频辨识系统及辨识方法

成果类型:: 发明专利

发布时间: 2023-07-07 15:27:32

科技成果产业化落地方案
方案提交机构:天津市滨海新区| 宋学姮 | 2023-08-02 16:39:08
一种智能音频辨识系统及辨识方法,该系统包括一用于采集并存储各类标本音频数据的音频数据集、一训练单元、以及辨识单元;所述训练单元用于提取样本音频数据的特征向量,并寻找和建立从样本音频数据特征向量到所属类别之间的映射关系;所述辨识单元用于存放已建立的样本音频数据特征向量与所属类别之间映射关系的数据,以及提取待辨识音频数据特征向量,并根据待辨识音频数据的特征向量,给出辨识结果。本发明的系统及方法能够对音频数据进行自动辨识,并且系统具有良好的实时性和扩展能力。
一种智能音频辨识方法,包括以下步骤:A、采集各种样本音频数据,对采集到的样本音频数据进行标注;B、逐一从所述样本音频数据中提取出反映样本音频数据本质特征的特征向量,其中包括以下步骤:B1、对所述样本音频数据进行预处理,得到训练数据;B2、从训练数据中提取反映训练数据本质特征的特征成分;B3、将所述特征成分进行组合,得到所述特征向量;C、根据所述特征向量划分样本音频数据所属类别区域,使得划分后的各个不同类别区域中包含尽量多的该类样本的特征向量,建立从特征向量到所属类别之间映射关系的分类器;D、对待辨识音频数据进行处理,提取待辨识音频数据的特征向量,其中包括以下步骤:D1、对所述待辨识音频数据进行预处理,得到辨识数据;D2、从辨识数据中提取反映辨识数据本质特征的特征成分;D3、将所述特征成分进行组合,得到所述特征向量;所述步骤B2或D2所述的特征成分包括:音频的中心频率、数个特定频率段内音频的能量特征或多个时段内音频的能量分布特征;E、将待辨识音频数据的特征向量输入到所述分类器,分类器根据所述待辨识音频数据的特征向量进行判别,得到对该待辨识音频数据的辨识结果.

听觉是人类获取外部信息的重要来源之一,也是人类用于分辨外部发生情况的重 要渠道,如:当听到狗叫声,就可以判定附近可能有狗;当听到尖叫声,就可判定附近可能 有人受到伤害。通过对音频的分析可以提供给本发明许多重要的信息。目前大多数基于音 频的分析系统主要完成的功能是对采集到的原始音频进行预处理,如:去噪声,提取或加强 指定特征的音频,但最后对音频的辨识都需要人的参与。而在自然界众多的应用场合中,需 要对不同声响进行自动辨识,例如,对于在野外从事野生动物科研工作的野生动物学家,需 要花费很多时间追踪一些罕见的野生动物,如果能有音频数据自动辨识系统来辨识某种 野生动物的叫声,当辨识出该种动物的声音后发出信号,则能帮助野生动物学家进行追踪。 又如可在电梯、家庭设有对音频自动辨识系统的话,就可以对尖叫声、打闹声、撞击声、玻璃 破碎声、爆炸声、枪击声等异常声响进行自动辨识,并发出报警信号给监控人员,从而提高 监控人员对异常情况处理的反应时间。因此,实现自动的对音频进行辨识,将具有重要、广 泛的应用价值。

中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。

所述的系统,其中:所述辨识单元包括第二预处理模块、第二特征提取模块以及分 类器,所述第二预处理模块用于对待辨识音频数据进行去噪处理,得到辨识数据;所述第二 特征提取模块用于从辨识数据中提取待辨识音频数据的特征向量,所述分类器用于存放所 述训练模块输出的音频数据特征向量与音频数据所属类别之间映射关系的数据,并根据输 入的待辨识音频数据的特征向量,输出辨识结果。

[0022] 本发明的有益效果为:采用本发明的智能音频辨识系统及方法,能够对音频数据 进行自动辨识,并且系统具有良好的实时性和扩展能力。

技术合作


本发明的智能音频辨识系统可以用于多种场合下的智能监控。如:可在电梯内安 装该系统,对尖叫声、打闹声、撞击声等不正常声响进行自动辨识,并发出报警信号给监控 人员,从而提高对电梯内异常情况处理的反应时间,同时可以减轻电梯监控人员的工作负 担。该系统还可用于家庭监控。在户内安装该系统后,系统可对玻璃破碎声、门口的撞击 声、爆炸声、枪击声等在室内可能发生的异常声响进行辨识,当辨识到这些异常声响后立即 发出报警信号,从而有效的防止通过破坏门窗入室盗窃等犯罪行为的发生。该系统还可安 装在室外,自动的辨识雷声、风声、雨声等与天气相关的声响,实时的对天气状况进行监测。 另外,该系统还可帮助在野外工作的野生动物学家进行科研工作。野生动物学家往往需要 花费几星期甚至几个月的时间追踪一些罕见的野生动物,本发明可以通过在指定区域撒 播安装有该系统的无线传感器,来辨识某种野生动物的叫声,当辨识出该种动物的声音后 发出信号,帮助野生动物学家进行追踪。该系统还可用于机械故障的诊断。当机器发生故 障时,会发出异于机器工作正常时发出的声响,而且不同的故障发出的故障声响也不相同。 该系统就可以根据几种不同的故障音频进行学习,然后安装在机器附近实时的对机器工作 声响进行辨识,当辨识出故障声响后报警并给出可能的故障类别,该结果可帮助人们及时 的发现机器故障,并为机器的故障诊断提供依据。该系统还可以应用于基于互联网的音频 检索以及基于音频的场景分析中。[0051] 应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换, 而所有这些改进和变换都应属于本发明所附权利要求的保护范围。