成果介绍
一种智能音频辨识系统及辨识方法,该系统包括一用于采集并存储各类标本音频数据的音频数据集、一训练单元、以及辨识单元;所述训练单元用于提取样本音频数据的特征向量,并寻找和建立从样本音频数据特征向量到所属类别之间的映射关系;所述辨识单元用于存放已建立的样本音频数据特征向量与所属类别之间映射关系的数据,以及提取待辨识音频数据特征向量,并根据待辨识音频数据的特征向量,给出辨识结果。本发明的系统及方法能够对音频数据进行自动辨识,并且系统具有良好的实时性和扩展能力。
成果亮点
一种智能音频辨识方法,包括以下步骤:A、采集各种样本音频数据,对采集到的样本音频数据进行标注;B、逐一从所述样本音频数据中提取出反映样本音频数据本质特征的特征向量,其中包括以下步骤:B1、对所述样本音频数据进行预处理,得到训练数据;B2、从训练数据中提取反映训练数据本质特征的特征成分;B3、将所述特征成分进行组合,得到所述特征向量;C、根据所述特征向量划分样本音频数据所属类别区域,使得划分后的各个不同类别区域中包含尽量多的该类样本的特征向量,建立从特征向量到所属类别之间映射关系的分类器;D、对待辨识音频数据进行处理,提取待辨识音频数据的特征向量,其中包括以下步骤:D1、对所述待辨识音频数据进行预处理,得到辨识数据;D2、从辨识数据中提取反映辨识数据本质特征的特征成分;D3、将所述特征成分进行组合,得到所述特征向量;所述步骤B2或D2所述的特征成分包括:音频的中心频率、数个特定频率段内音频的能量特征或多个时段内音频的能量分布特征;E、将待辨识音频数据的特征向量输入到所述分类器,分类器根据所述待辨识音频数据的特征向量进行判别,得到对该待辨识音频数据的辨识结果.
团队介绍
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
成果资料
产业化落地方案