本发明公开了一种多特征双向门控领域专家实体抽取方法及系统。该方法首先通过构建领域专家语料库以训练实体抽取模型;接着,使用BERT方法进行字嵌入表示,对语料库专业领域词汇构造要素进行特征分析并提取边界特征;然后,利用双向门控神经网络和注意力机制有效获取特定词语长距离依赖关系;最后,结合条件随机场模型实现命名实体识别,将抽取后的信息建立高质量的实体信息索引项返还WEB应用系统。本发明方法可有效抽取领域专家信息实体,充分利用文本字嵌入特征、边界特征以及上下文特征以获得更好的NER性能,从而解决人工特征提取成本高和专业新词无法识别等问题。
发明目的:为解决领域专家信息抽取过程中人工特征提取成本高和专业新词无法识别等问题,本发明提供一种多特征双向门控领域专家实体抽取方法及系统,充分利用领域专业术语在文档中的特征,结合门控神经网络可以从上下文中自动找到更有用的单词以提取指定类型的关键性信息。
此技术是淮阴工学院李翔研发,淮阴工学院,位于江苏省淮安市,宗旨和业务范围是“培养高等学历人才,促进社会发展。工学类、理学类、经济学类、管理学类、文学类、法学类、艺术学类和农学类学科本科学历教育工程硕士研究生学历教育相关科学研究技术开发继续教育专业培训学术交流与咨询服务会议展览服务”。
评价单位:- (-)
评价时间:2023-11-10
综合评价
技术转让,所需资金需双方协商,此项技术想尽快落地保定,希望具备此项技术研发的技术方,能够尽快承接次项目
查看更多>