基于音频流的声纹识别
价格 双方协商
地区: 湖南省 长沙市 市辖区
需求方: 湖南***公司
行业领域
电子信息技术,高技术服务业,图像音像
需求背景
现有终端设备上的录音器或摄像器可以方便用户录制和拍摄音频和视频文件。随 着终端设备的性能提高,存储容量增大,多媒体应用程序的种类增多等条件,用户很容易录 制或拍摄大量的音频/视频文件。然而,面对着大量音频/视频文件,当用户需要查找所有录 制有某个特定联系人的音频/视频文件,或查找和播放某个特定联系人在某个音频/视频文 件中的某一段特定信息时,由于无法快速定位,会遇到无从查找的情况。只有一个一个文件 的播放查看,才能得到所需文件或片段。
需解决的主要技术难题
基于音频流的声纹识别,类似于听歌识曲,达到低延时、高准确率;达到数据清洗、敏感词比对等要求,NLP技术;防止内容数据在传输过程中被非法篡改;新闻及小程序平台的技术和运营支持;云平台的数据安全管理及风险防范;音乐版权授权
期望实现的主要技术目标
需要提供一种快速查找和分类目标音频/视频文件,并定位特定联系人 在该文件中出现时间点的方法和终端设备,以方便用户查找录制有特定人员声音和视频的文件。
需求解析
解析单位:“科创中国”人工智能专业科技服务团(中国人工智能学会) 解析时间:2022-12-19
倪晶
中关村芯海择优科技有限公司
陈小锋
综合评价
处理进度