成果介绍
信息爆发时代,有效率有质量地整理视频、音频、文字等信息变得尤为重要。会议,培训,采访等场景均需要形成完整的文字记录材料,音视频文件也需要配有字幕。本公司研发的aivox 语音会议记录软件通过WebSocket协议,建立应用与语音转写核心引擎的长连接,将音频流数据实时转换成文字流数据结果。实现即时对语音内容的识别,展现对应文字内容。同时,aivox 语音会议记录软件的识别引擎采用拥有自主研发全新推出的深度全序列卷积神经网络识别框架。使用大量的卷积层直接对整句语音信号进行建模,更好的表达了语音的长时相关性,比学术界和工业界最好的双向递归神经网络的语音识别系统识别率提升了 15%以上。同时结合公司的 HPC 平台和多 GPU 并行加速技术,训练速度也优于传统的双向 LSTM CTC 系统。
成果亮点
aivox 语音会议记录软件的实时语音转写基于深度全序列卷积神经网络框架,语音识别技术全球领先,在安静环境,普通话标准下转写准确率可达95%以上。aivox 语音会议记录软件具有上下文纠错功能。在一句话结束之后,针对上下文进行语义理解,将转写过程中的语音识别结果进行智能纠错,确保识别的准确性。aivox 语音会议记录软件可以进行文法格式智能转换: 对结果中出现数字、日期、时间等内容,将它们格式化成规整的文本,例如“五点三十”引擎会识别规整为“5:30”。运用超大规模的语言模型,让aivox 语音会议记录技术可以智能预测语境,提供智能断句和标点符号的预测。
团队介绍
宁波维度数字科技有限公司是一家科技型的中小企业。注册资本为***万元人民币,成立日期为2020-06-29。主营业务::软件开发;信息系统集成服务;信息技术咨询服务;电子元器件零售;集成电路芯片设计及服务;集成电路芯片及产品销售;计算机软硬件及辅助设备零售;计算机软硬件及辅助设备批发。致力于智慧城市产业研究、规划、设计和智能高新技术产品开发与应用的综合性企业,承接各类智慧城市、智慧医疗、智能交通、智能建筑、智慧市政等项目的规划设计及施工。是建设部建设行业智能建筑试点项目技术依托单位,中国建筑业协会智能建筑专业委员会委员,中国自动化学会智能建筑与楼宇自动化专业委员会团体会员。集产学研为一体,形成汇聚科技领先企业、招纳行业高端人才、创造丰厚产值的高科技产业集群;实践和展示智慧城市建设的最新成果,实现和升级更有效地生产方式、管理方式。
成果资料