您所在的位置: 成果库 基于音视频识别及语义分析的智能约谈平台

基于音视频识别及语义分析的智能约谈平台

发布时间: 2022-09-14

来源: 试点城市(园区)

基本信息

合作方式: 创业融资
成果类型: 新技术
行业领域:
电子信息技术,计算机及网络技术
成果介绍
主要技术指标: (1)线上、线下约谈:平台自主研发,支持国产软硬件环境,实现线上约谈、线下 固定式场景约谈、线下走读式场景约谈。 (2)约谈预约:系统提供线上约谈预约服务,预约选择约谈类型、约谈时间等。 (3)身份认证:约谈人通过身份证扫描和人脸识别对比核验身份。 (4)语音识别:平均正确识别率不低于 96%。 (5)说话人分离:识别角色错误率低于 10%、响应时间小于 1500ms。 (6)语音转写:转写速度高于 350 字 / 分、正确率高于 95%、响应时间小于 500ms。转写过程中过滤音频中的重复词、语气词、禁忌词。 (7) 音视文同步: 约谈内容实现音频、视频、文本(字幕) 同步显示, 字幕生成准 确度不低于 90%。 (8)约谈问题引导:约谈过程中系统自动生成约谈问题,供约谈人参考提问。 (9)约谈摘要自动生成:约谈结束后系统自动生成汇报摘要 相关成果: (1)软件:研发 1 套面向国产软硬件环境的自主知识产权的智能约谈音视频识别及 语义分析平台。 (2)硬件:智能约谈主机、音视频一体机、阵列麦克风主板、定向麦克风、音频分 离器等。
成果亮点
基于AI深度学习的音视频识别框架、复杂网络理论和语义知识本体的文本语义相似度计算方法,研究音视频识别的语音转写、对话管理、计算机视觉技术和内容分析的语义理解、语义优化、情感识别方法,实现网信约谈、纪委约谈、公安审讯、监狱谈话等多种行政约谈场景下的约谈智能化和数字化。其中,语音识别转写是开展智能约谈系统研究的前提和基础,本成果训练了声学模型和语言模型,构建编码器,通过音频角色分离和声纹识别技术分离说话人声音,编码器识别解码,经过文本语义处理转写为文本。而文本语义处理是智能约谈系统提升约谈效能的源动力,成果构建了基于语义本体的自动专家导引约谈知识库,通过基于复杂网络的语义相似度计算给约谈工作人员推荐约谈问题;约谈结束后,利用融合主题特征的文本自动摘要技术快速生成汇报摘要,利用基于分布式表示的事件抽取技术自动生成约谈报告。本成果研制高效、便捷的智能约谈音视频识别及语义分析平台,实现了在线约谈预约、人脸识别身份核验、语音实时转写、约谈问题智能引导提问、音视文同
团队介绍
技术转移中心是经陕西省科技厅批准设立的省级技术转移示范机构,成立于2012年7月16日。依托学校科学研究院,联合学校产业集团、国家大学科技园,以学校的科研力量为支撑,将信息与电子学科特色与区域经济发展相结合,加强与各级政府、企业、科研院所对接,积极为广大师生做好服务,共同推进学校技术转移和科技成果就地转化。
成果资料
成果综合评价报告

评价单位:- (-) 评价时间:2023-10-28

李卫斌

西安电子科技大学

教授

综合评价

该技术创新性很强,且技术成熟,投资回报比较可靠。总体而言,该项技术思路方向很好,未来市场空间较大,有利于当前政策要求,转化成熟度高,值得支持推广。建议强化相应产品开发,加大产业链开发力度。
查看更多>
更多