_科创中国

一种说话人识别方法和装置

成果类型：: 发明专利

发布时间: 2022-11-30 09:34:05

科技成果产业化落地方案

方案提交机构：天津市滨海新区| 郝建平 | 2022-12-05 14:57:38

成果简介技术亮点应用前景团队概括产生的效益转化方式

本发明适用于说话人识别领域，提供了一种说话人识别方法和装置，该方法包括：提取JFA说话人超向量，所述JFA说话人超向量为通过联合因子分析方法去除信道信息影响的高斯混合模型GMM超向量；对所提取的JFA说话人超向量进行分段，将JFA说话人超向量划分为多个子向量集；根据分段所得到的多个子向量集，对每个子向量集进行非参数区分分析，建立子空间说话人模型；根据所述子空间说话人模型获取待识别说话人的参考向量以及训练样本说话人的参考向量进行说话人识别。和现有技术相比，本发明运算量小；而且测试数据收集简单，提高识别性能。

一种说话人识别方法，其特征在于,所述方法包括：提取JFA说话人超向量，所述JFA说话人超向量为通过联合因子分析方法去除信道信息影响的高斯混合模型GMM超向量；对所提取的JFA说话人超向量进行分段，将JFA说话人超向量划分为多个子向量集；根据分段所得到的多个子向量集，对每个子向量集进行非参数区分分析，建立子空间说话人模型；根据所述子空间说话人模型获取待识别说话人的参考向量以及训练样本说话人的参考向量，根据预设的计算规则，以及所述待识别说话人的参考向量以及所述训练样本说话人的参考向量进行说话人识别。

随着计算机技术及互联网技术的不断进步，智能设备在人们的生活中已经变得越来越不可或缺。而作为人与智能设备之间交互方式之一的语音交互，由于其具有采集简便、易于存储、难于模仿、语音获取的成本低廉等特性，也成为了研究领域的热点。

目前的智能语音处理方式，根据所利用的语音信息的不同，主要分为：语音识别 (Speech Recognition)、语种识别（Language Recognition)以及说话人识别（Speaker Recognition)等。其中，语音识别的目标在于判断出语音信号中所传递的是何种语义信息；语种识别的目标是识别出语音信号所属的语言种类或者方言类型;说话人识别则是通过提取表征说话人的个性特征，识别出说话人的身份。

中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力，推动我国自主知识产权新工业的建立，成为国际一流的工业研究院。深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统，由九个研究平台，国科大深圳先进技术学院，多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究，促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。

在本发明中，提取了说话人的去除信道信息影响的GMM超向量作为JFA说话人超向量，既能够详细描述说话人的个性特征，又去除了通信信息的影响，通过对JFA说话人超向量进行分段后，再进行非参数区分分析，建立子空间说话人模型，由训练好的子空间说话人模型获取待识别说话人的参考向量以及训练样本说话人的参考向量，根据预设的计算规则进行识别。和现有技术相比，由于对JFA超向量进行了非参数区分分析，进而提取了类别边界的区分信息，从而提高说话人识别系统性能。

技术合作

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

科创中国

友情链接

海外专利信息资源系统

省级中心站