成果介绍
该成果基于国内领先的汉-东南亚语言大型语料库,重点研究了基于完成自注意力机制的端到端神经机器翻译核心技术,在数据增强、命名实体翻译、模型压缩和半监督训练等方面进行了优化,研发了支持在移动和小型智能设备上离线嵌入运行的神经机器翻译技术,以及在云端平台上支持大规模并发应用的工程优化技术,应用华为人工智慧云资源所提供的GPU资源进行模型训练和迭代调优,最终实现了达到商用水平的汉语-东南亚语(越南语、泰语、印尼语和马来语)双向机器翻译引擎,翻译效果全面超越传统统计机器翻译方法,达到国际先进水平,最早填补了国内空白。在此基础上,研发了面向大规模应用的翻译服务云平台、领域定制翻译系统以及语音翻译机、翻译笔、多语种会议同传系统、音视频翻译平台、跨语言实时交流、智能辅助翻译、人机结合精准翻译、软件本地化/国际化等面向具体应用场景(旅游、文化出版、外贸等)的多个智能软硬件产品。
成果亮点
汉-东南亚神经机器翻译引擎达到国际先进水平,突破“卡脖子”的核心关键技术,最早填补国内空白; 2)基于自主研发的多语种语料自动化处理及管理平台,建成国内最大规模的汉语-东南亚语言语料库; 3)研制了在线/离线定制机器翻译系统、语音翻译机、翻译笔、多语种会议同传系统、音视频翻译平台、跨语言实时交流、智能辅助翻译等AI翻译软硬件应用产品。
团队介绍
成果研发团队是国内最早从事汉-东南亚语言机器翻译研究的团队,研发团队骨干长期从事东南亚语言的自然语言理解、机器翻译、语言资源库建设研究,近年来承担了近十项东南亚语言机器翻译方向的自治区和南宁市的科技计划项目。牵头制定国家软件工程标准4 项(广西唯一)、参与制定9 项。获得软件著作权59项。获得“中国—东盟新型智慧城市协同创新大赛2020”人工智能组亚军和2021年八桂人工智能科技进步奖第二名。
成果资料