AI降噪与语音识别优化的技术研究

发布时间: 2023-09-19

来源: 科技服务团

截止日期:2023-09-19

价格双方协商

地区：北京市市辖区顺义区

需求方：北京***公司

行业领域

新一代信息技术产业,人工智能

需求背景

随着现代社会的发展，噪音污染变得越来越严重，噪音会对语音识别系统的性能产生不利影响，使得语音识别率下降。因此，为了提高语音识别系统的性能，需要对带噪语音信号进行降噪处理。

需解决的主要技术难题

1.针对复杂声学场景，提高声学回声消除的性能
2.探索在噪声、人声干扰下，利用多通道信息和说话人提取等方法提升多人对话场景下的语音识别性能

期望实现的主要技术目标

1.语音识别错误率相对强基线降低相对10%以上
2.声学回声消除ERLE达到40db
3.多模态场景下在指定测试集提升唤醒率5%
4.自定义在12小时一次误唤醒的情况下达到85%的唤醒率
5.在双方指定的挑战测试集上，语音ERLE达到30db

需求解析

解析单位：“科创中国”陕西科技服务团（陕西省科学技术协会） 解析时间：2023-11-23

赵燕琦

陕西省科普宣传教育中心

副主任

综合评价

该项目技术需求背景说明清晰，需解决的技术难题表述明确，期望实现的技术目标合理可行。其技术方案框架或技术解决路径建议如下： 1.解决噪音干扰问题：利用AI技术中的降噪算法，通过分析音频信号的频谱特征，将噪音部分从音频信号中剔除，从而提高音频识别的准确性。 2.解决口音差异问题：利用AI技术中的语音模型，通过大量的训练数据学习到不同口音的特征，从而提高对口音的识别能力。 3.解决实时性问题：在保证降噪效果的同时，需要保证算法的实时性。这需要优化算法，减少计算量和复杂度，从而提高算法的执行效率。 4.解决模型适用性问题：AI模型需要适应各种不同的场景和需求。需要研发多种模型，并对模型进行训练和优化，以提高模型的适应性和鲁棒性。对产业发展的意义主要体现在以下方面： 1.提高语音识别的准确性和性能，减少错误率，提高生产效率和质量。 2.实现智能化生产模式，优化生产流程，降低生产成本，提高产业效益。 3.促进语音识别技术在各行业的应用和发展，推动产业升级和转型。为人们提供更加智能化的语音交互体验，改善生活品质。

解析单位：陕西省西咸新区 解析时间：2023-09-20

齐晓光

西北大学

教授

综合评价

随着科学技术的发展，语音识别技术已经逐渐走向成熟，目前语音识别技术常应用在工业、家电、通信、医疗等各个领域，人们可以通过语音识别装置，实现语音操控，给生产、生活带来极大的便利。在工业应用时，由于语音识别装置应用环境的不同，通常会在语音识别装置上加装降噪装置，目前主要采用的是降噪麦克风音箱，它主要由八位环形麦克风阵列模组、AI智能模组、以及扬声器组成，通过八位环形麦克风阵列模组，能够对周围环境进行降噪，消除噪音、回声等，实现清晰拾音，同时通过AI智能模组，能够有效抑制各种嘈杂的噪音、设备运转声等，保留清晰自然的语音原声，确保语音识别装置准确的识别。

处理进度

提交需求

2023-09-19 15:38:28
确认需求

2023-09-20 10:04:45
需求服务
需求签约
需求完成

科创中国

友情链接

海外专利信息资源系统 企业技术创新力在线自测系统

省级中心站

科创中国

友情链接

海外专利信息资源系统 企业技术创新力在线自测系统

省级中心站

海外专利信息资源系统企业技术创新力在线自测系统