东南亚语言处理技术合作
价格 双方协商
地区: 广西壮族自治区 南宁市 西乡塘区
需求方: 广西***公司
行业领域
新一代信息技术产业,信息传输、软件和信息技术服务业
需求背景
广西达译科技有限公司专门从事东南亚语言处理技术研发与服务,研发团队骨干在机器翻译为主的研发方面经验丰富,承担过国家项目3个、省级项目10个、市级项目7个;语言工程队伍包括英语和东南亚语言的资深语言人员,并外聘计算机和语言专家42人,外聘译员300余人,有效地补充语言专业人员与能力。已研发具有自主知识产权的软件产品40余个,获软件著作权50项,申请发明专利9项,牵头制定国家软件工程标准3项、参与制定2项;建设有汉/英、越、泰、马来、印尼、老、缅、柬单语和双语语料库,单语和双语语料达数千万,在东南亚机器翻译种类和语料数量与品种方面具国内领先。
为提供更专业的服务,提升产品竞争力,现需要寻求东南亚语言处理技术合作。
需解决的主要技术难题
在东南亚小语种语言的机器翻译过程中,语料库的建设完备程度、针对小语种的自然语言识别人工智能算法(NLP)起到关键作用。我司希望与外部专家团队共同合作,一方面进一步提升我司现有东南亚各国语料库对常用预料的覆盖范围,并对更多语言场景的语料数据进行标注关联,以更好地用于相关识别算法的训练和应用;另一方面针对现有的文字、语音识别算法进行针对性的优化,或合作开发基于新理论的人工智能识别算法,提升于小语种语言的智能识别翻译的精度。
期望实现的主要技术目标
1.对当前东南亚各国小语种语料库进行增建扩充,通过爬虫等各种方式,新增小语种语料1000万条以上;
2.优化当前基于NLP的文字及语音识别算法,将识别准确率从当前的不足80%提升至90%以上;
处理进度