成果介绍
本发明属于信息抽取技术领域,公开了一种基于标注的事件抽取方法,结合标注与神经网络来进行事件抽取,首先进行数据处理得到一个事件实体的标注标签,然后用神经网络来训练标注好的数据,得到结构化的事件抽取的结果;对于输入的句子,通过实体识别和基于神经网络的事件抽取模型,直接得到有事件的实体标签;本发明提供的方法由于可直接得到有事件的实体标签,因此不会造成错误传递,没有冗余信息,有效降低错误率;另一方面本发明提供的基于标注的事件抽取方法,通过改进类别的权重的方式来得到损失函数,可缓解类别不平衡所引起的模型倾向预测较多数据类别。
成果亮点
以Bi-LSTM作为神经网络模型,将标注好的语料正向和逆向分别输入到Bi-LSTM的两个LSTM网络中,分别得到正向和逆向的特征向量,将这两个特征向量拼接在一起得到上下文特征向量;根据上下文特征向量计算预测的标注标签概率,根据标注标签概率建立损失函数;
对网络参数进行初始化,输入训练数据对神经网络模型的参数进行优化;在测试集上对神经网络模型进行评估,当在测试集合上的抽取准确率在预设阈值区间内,判定神经网络模型达到收敛;
将待抽取文本输入训练好的神经网络模型中,预测序列每一个字符的标签预测结果;依据标签预测结果对文本进行拼接,得到结构化的事件抽取结果。
团队介绍
园宝科技(武汉)有限公司位于武汉东湖新技术开发区关东街道大学园路15号附1号华中科技大学科技园现代服务业示范基地二期4栋705,所属行业为软件和信息技术服务业,经营范围包含:计算机软硬件技术开发、技术咨询、技术转让、技术服务;信息系统集成服务;信息技术咨询服务;基础软件服务;应用软件服务;数据处理;计算机及辅助设备
成果资料
产业化落地方案