本发明属于依存句法分析技术领域,具体涉及一种文本依存句法分析方法。依存句法树是关系提取工作所需的重要依据,依存句法分析的目的是构建依存句法树,依存句法分析的准确性直接影响着关系提取等上层工作的精度,为了提高依存句法分析的准确性,本发明提出了基于Pointer‑Net与TreeLSTM相结合的神经网络模型的一种文本依存句法分析方法,该方法可以在依存分析的过程中兼顾上下文的语义特征,在每一步的决策过程中都会考虑到已生成的依存子树,进而提高依存句法分析的精度。
较大程度上减少在提取特征时因为词性标注所带来的错误蔓延并解决多层次特征无法获取的问题。综上所述依存句法分析中的几大难点为分词和词性标注的误差蔓延,依存子树的特征在转移决策时没有被完全利用,以及决策时没有考虑到历史决策信息。
大数据国家工程研究中心累计投资3亿余元条件建设和科研运行经费,完成科研条件建设,组建了一支330余人的科研团队,其中,专业技术人员271人,博士46人,硕士研究生142人,正高级职称23人,高级工程师55人。同时聘请了陈润生、沈昌祥、王陇德、杨小牛、岳清瑞、王坚等6位院士担任领军专家。
评价单位:“科创中国”贵州科技服务团 (贵州省科学技术协会)
评价时间:2023-11-05
综合评价
该成果为人工智能领域,对依存句法分析主流领域有一定的引领性作用,该方法具备端到端的深度学习模型、上下文感知的表示学习、多语言和跨领域适应性以及高效的计算和推理能力等技术亮点。这些亮点可以提高依存关系预测的准确性和效率,进一步推动文本依存句法分析技术的发展和应用。
但将文本依存句法分析技术产品化的关键是将其应用于实际场景,并提供易于使用的接口。专家建议可以开发适用于不同平台和领域的软件开发包(SDK),如Python或Java SDK,以方便开发人员集成到自己的应用程序中。此外,还可以开发基于云计算的文本依存句法分析服务,为用户提供在线的API接口,以实现快速且实时的文本依存句法分析。同时,积极与行业合作伙伴建立合作关系,共同推进文本依存句法分析技术的应用和推广。此外,要加强知识产权保护,保护自己的技术优势和核心竞争力。最后,寻求投资和融资支持,为技术的推广和落地提供资金保障。
查看更多>