成果介绍
基于Transformer的神经机器翻译(NMT)模型在机器翻译领域已展现出卓越的性能,然而该模型在处理单词语义重要性方面存在局限,特别是当实词在句子中承担更为关键的角色时。在低资源翻译场景中,这一问题尤为凸显,导致翻译质量的显著下降。
成果亮点
为了缓解这一问题,本文提出了一种内容词扩充(CWA)方法优化低资源翻译任务的编码器。该方法首先利用内容词选择算法,将句子中的词汇精准地划分为内容词和虚词;接着采用两种融合策略,将内容词的词嵌入融入NMT模型中,从而优化编码器的功能。
通过在一系列翻译任务上的广泛实验验证,CWA方法与基线模型相比,BLEU评分提升范围从0.24显著跃升至0.57,充分证明了该方法在低资源翻译任务中的有效性和实用性。
团队介绍
*** Li, Zhongchao Zhao, Hong Yan and Zhen Zhang. A Content Word Augmentation Method for Low-Resource Neural Machine Translation. Advanced Intelligent Computing Technology and Applications. ICIC 2023. (CCF C类会议、EI检索)
成果资料