您所在的位置: 成果库 语音情感识别方法、装置、设备及存储介质

语音情感识别方法、装置、设备及存储介质

成果类型:: 发明专利

发布时间: 2023-10-14 10:49:58

科技成果产业化落地方案
方案提交机构:成果发布人| 张芳 | 2023-10-14 10:49:58

一种语音情感识别方法,其特征在于,包括:获取待识别的语音数据;提取所述语音数据对应的多模态情感特征数据;所述多模态情感特征数据包括以下至少一项:所述语音数据的语音情感特征数据、所述语音数据对应的文本数据的文本情感特征数据;确定用于进行情感分类的支持向量机分类器的优化参数;所述优化参数为利用基于混沌扰动和/或柯西变异扰动的猫群算法对所述支持向量机分类器的初始模型参数进行优化后得到的模型参数;将所述多模态情感特征数据和所述优化参数输入所述支持向量机分类器,以使所述支持向量机分类器对所述语音数据进行情感识别,得到所述语音数据对应的情感类别。

本发明实施例公开了一种语音情感识别方法、装置、设备及存储介质,以解决现有技术中对语音情感的识别准确性较低的问题。该方法包括:获取待识别的语音数据;提取语音数据对应的多模态情感特征数据(包括语音数据的语音情感特征数据、语音数据对应的文本数据的文本情感特征数据中的至少一项);确定用于进行情感分类的支持向量机分类器的优化参数;优化参数为利用基于混沌扰动和/或柯西变异扰动的猫群算法对支持向量机分类器的初始模型参数进行优化后得到的模型参数;将多模态情感特征数据和优化参数输入支持向量机分类器,以得到语音数据对应的情感类别。该技术方案能够更加精确的识别出语音数据对应的情感类别,提高了语音情感识别的准确率。

研究表明,人类交流过程中,80%的信息都是跟情感相关的信息。对语音数据进行语音情感识别,尤其是在客户服务的场景下,能够快速、准确地察觉客户情感的变化,尤其是客户的负面情绪(如失望、抱怨、愤怒等),对提升运营商的服务质量和用户体验具有重要意义。

传统的语音情感识别技术中,受数据传输及存储方式的限制,语音情感信息都需要从文本中获取,因此语音情感识别的对象一般是文本数据,但是文本数据无法全面概括语音数据的特点,且对文本数据进行情感分类的softmax分类器的情感分类准确度较低,从而导致现有技术中对语音数据的语音情感的识别准确性较低。

湖北文理学院(Hubei University of Arts and Science)是省属全日制普通本科高等院校,位于全国历史文化名城、湖北省域副中心城市—襄阳市,地处中华民族智慧化身诸葛亮的故居—古隆中。学校办学历史最早可以追溯到创办于1958年的襄阳师范专科学校;1966-1978年,武汉大学襄阳分校在此设立;1998年3月,襄阳师范高等专科学校、襄樊职业大学、襄樊教育学院合并组建襄樊学院;2000年7月,湖北省工艺美术学校整体并入;2012年2月,更名为湖北文理学院。截至2022年12月,学校设有二级学院18个,开设本科专业59个;拥有2个一级学科硕士学位授权点、11个硕士专业学位授权点;有教职工1675人,专任教师1168人;全日制在校生19000余人。

在本发明实施例中,通过获取待识别的语音数据,提取语音数据对应的多模态情感特征数据,确定用于进行情感分类的支持向量机分类器的优化参数,从而将多模态情感特征数据和优化参数输入支持向量机分类器,以使支持向量机分类器对语音数据进行情感识别,得到语音数据对应的情感类别。由于相较于单一模态的语音特征数据或文本特征数据而言,语音数据对应的多模态情感特征数据能够更加准确地表达出该语音数据的情感,因此能够提高语音情感识别的准确率。并且,通过基于混沌扰动和/或柯西变异扰动的猫群算法对支持向量机分类器的初始模型参数进行优化,得到优化参数,能够避免猫群算法的解陷入局部最优的问题,提升了猫群算法的全局优化能力和收敛速度,能够得到更加精确的优化参数,从而提升了支持向量机分类器的情感分类准确度,基于该支持向量机分类器对输入的多模态情感特征数据进行情感识别,能够更加精确的识别出语音数据对应的情感类别。

本专利成果采用技术转让,技术入股,技术合作等成果转化方式,希望进一步实现该专利的有益效果,有兴趣皆可面议。