您所在的位置: 成果库 TransWAI智能化语言服务云平台

TransWAI智能化语言服务云平台

发布时间: 2023-07-31

基本信息

合作方式: 股权融资
成果类型: 发明专利,软件著作权
行业领域:
新一代信息技术产业
成果介绍
产品介绍 TransWAI是一个集语音前端检测、语音识别、机器翻译、语音合成等核心技术于一身的音视频翻译平台,能够覆盖音视频转写、翻译、编辑、压制以及语音合成的字幕生产全流程,为用户节省字幕处理成本、提升音视频字幕处理效率。 三、 技术介绍 语音终端检测技术:语音终端检测的主要任务是从带有噪音的语音中准确定位出语音的开始和结束点,精准切分字幕段落,这是字幕文件的生成基础,音视频翻译平台使用机器学习的方法来检测语音端点,在各类带场景下有较为优异的表现。 语音识别技术:机器通过识别和理解把语音信号转变为相应的文本或命令的高技术,音视频翻译平台的语音识别服务来自国内顶尖语音技术的供应商,采用先进的基于深度学习DNN模型的识别引擎,配合LF-MMI框架,拥有30万小时以上的训练数据,使用语言模型自适应、声学模型自适应等方法优化专业领域的语音识别。语音识别响应速度达到RTF<***,现阶段支持英文语音识别和俄文语音识别,语音识别实时率在***以内,英文语音识别准确率在90%以上。后续将陆续开放其他语种或方言的识别能力。
成果亮点
先进的语音识别功能 采用先进的深度学习神经网络算法,将音轨从视频剥离转换为文本。可视化字幕编辑器,用户可以通过时间轴的简易拖动,为用户提供方便快捷的字幕创建与编辑。 精准的机器翻译功能 在使用数十亿句对的高质量行业精准语料进行训练的基础上,支持86种语言对互译,涵盖通用、传媒、教育、跨境电商、传统翻译等多个垂直领域,实现多语言翻译模型的训练以及研究,针对不同的领域需要收集大量的专业语料,将一个语言方向训练到可商化的级别需要投入不少于500万句对的语料,训练时需近200小时。 快捷的字幕编辑提供 通过 AI 智能切割时间轴,生成时间戳,在线编辑调整字幕,用户仅需简单编辑即可出稿,使用便捷。 多样的字幕格式 提供一键压制字幕功能,为视频加上字幕,支持 mp4常见视频格式的压制导出。语音合成基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,提供多场景音库,支持多种参数配置,可根据场景对音库、语速、音调、音量进行灵活的设置。
团队介绍
丁丽:深圳云译科技有限公司 创始人/董事 北京大学MBA 深圳翻译协会副会长 中国翻译协会本地化委员会委员 中国计算机学会多语种信息处理专业委员会 副秘书长 长江大学外国语学院研究生行业导师 暨南大学翻译专业研究生实践指导教 广东省本科高校外语类专业教学指导指导委员会委员行业专家 史晓东:厦门大学博导、教授 厦门大学人工智能研究所所长 、厦门大学智能科学与技术系主任 中国中文信息学会常务理事和机器翻译专委会副主任 福建省人工智能学会常务理事 拥有授权专利2项,软件著作权12项,国际国内发表论文50多篇 主持国家863项目,承担科研项目30多项,国家社科重点基金、国家自然科学基金等20余项课题 陈毅东:厦门大学博士,副教授 福建省人工智能学会秘书长 中国中文信息学会语言与知识计算专业委员会委员 中国人工智能学会教育工作委员 智能传媒专业委员会委员 多家跨国上市公司机器翻译组、翻译机项目、机器同传项目负责人,带领团队多次获得机器翻译大赛奖项 刘开军 博士研究生 高级工程师 系统架构设计师 系统分析师 数据库系统工程师 信息系统管理工程师
成果资料