基于音视频识别及语义分析的智能约谈平台

发布时间: 2022-09-14

来源: 试点城市（园区）

基本信息

合作方式：创业融资

成果类型：新技术

行业领域：

电子信息技术,计算机及网络技术

成果介绍

主要技术指标：（1）线上、线下约谈：平台自主研发，支持国产软硬件环境，实现线上约谈、线下固定式场景约谈、线下走读式场景约谈。（2）约谈预约：系统提供线上约谈预约服务，预约选择约谈类型、约谈时间等。（3）身份认证：约谈人通过身份证扫描和人脸识别对比核验身份。（4）语音识别：平均正确识别率不低于 96%。（5）说话人分离：识别角色错误率低于 10%、响应时间小于 1500ms。（6）语音转写：转写速度高于 350 字 / 分、正确率高于 95%、响应时间小于 500ms。转写过程中过滤音频中的重复词、语气词、禁忌词。（7）音视文同步：约谈内容实现音频、视频、文本（字幕）同步显示，字幕生成准确度不低于 90%。（8）约谈问题引导：约谈过程中系统自动生成约谈问题，供约谈人参考提问。（9）约谈摘要自动生成：约谈结束后系统自动生成汇报摘要相关成果：（1）软件：研发 1 套面向国产软硬件环境的自主知识产权的智能约谈音视频识别及语义分析平台。（2）硬件：智能约谈主机、音视频一体机、阵列麦克风主板、定向麦克风、音频分离器等。

成果亮点

基于AI深度学习的音视频识别框架、复杂网络理论和语义知识本体的文本语义相似度计算方法，研究音视频识别的语音转写、对话管理、计算机视觉技术和内容分析的语义理解、语义优化、情感识别方法，实现网信约谈、纪委约谈、公安审讯、监狱谈话等多种行政约谈场景下的约谈智能化和数字化。其中，语音识别转写是开展智能约谈系统研究的前提和基础，本成果训练了声学模型和语言模型，构建编码器，通过音频角色分离和声纹识别技术分离说话人声音，编码器识别解码，经过文本语义处理转写为文本。而文本语义处理是智能约谈系统提升约谈效能的源动力，成果构建了基于语义本体的自动专家导引约谈知识库，通过基于复杂网络的语义相似度计算给约谈工作人员推荐约谈问题；约谈结束后，利用融合主题特征的文本自动摘要技术快速生成汇报摘要，利用基于分布式表示的事件抽取技术自动生成约谈报告。本成果研制高效、便捷的智能约谈音视频识别及语义分析平台，实现了在线约谈预约、人脸识别身份核验、语音实时转写、约谈问题智能引导提问、音视文同

团队介绍

技术转移中心是经陕西省科技厅批准设立的省级技术转移示范机构，成立于2012年7月16日。依托学校科学研究院，联合学校产业集团、国家大学科技园，以学校的科研力量为支撑，将信息与电子学科特色与区域经济发展相结合，加强与各级政府、企业、科研院所对接，积极为广大师生做好服务，共同推进学校技术转移和科技成果就地转化。

成果资料

成果综合评价报告

评价单位：- (-) 评价时间：2023-10-28

李卫斌

西安电子科技大学

教授

综合评价

该技术创新性很强，且技术成熟，投资回报比较可靠。总体而言，该项技术思路方向很好，未来市场空间较大，有利于当前政策要求，转化成熟度高，值得支持推广。建议强化相应产品开发，加大产业链开发力度。

科创中国

友情链接

海外专利信息资源系统

省级中心站