成果介绍
利用人工智能+语义理解技术,包括Sentence?Bert模型训练、专利标题向量化与存储、一对多专利余弦相似度计算、相似度排序与推荐,本发明结构科学合理,使用安全方便基于专利标题的匹配方法首先训练Sentence?Bert模型,运用Sentence?Bert模型对所有的标题文本进行向量化,然后将标题对应的向量存储到数据库中,当用户选择要匹配的标题时,首先从数据库查询该标题的向量,与在高校专利库中的向量逐一进行余弦相似度的计算,最后对余弦相似度的结果排序,选出大于预设阀值的高校专利。
成果亮点
结合标注与神经网络来进行事件抽取,首先进行数据处理得到一个事件实体的标注标签,然后用神经网络来训练标注好的数据,得到结构化的事件抽取的结果;对于输入的句子,通过实体识别和基于神经网络的事件抽取模型,直接得到有事件的实体标签;本发明提供的方法由于可直接得到有事件的实体标签,因此不会造成错误传递,没有冗余信息,有效降低错误率;另一方面本发明提供的基于标注的事件抽取方法,通过改进类别的权重的方式来得到损失函数,可缓解类别不平衡所引起的模型倾向预测较多数据类别。
团队介绍
申请(专利权)人:园宝科技(武汉)有限公司
发明人:王家奎
园宝科技(武汉)有限公司是一家致力于园区数字化转型、科技成果转化、产业升级的信息科技公司,拥有近50人的研发团队,52项自主知识产权,坐落在华中科技大学科技园,从事计算机软硬件技术开发、技术咨询、技术转让、技术服务;信息系统集成服务;信息技术咨询服务;基础软件服务;应用软件服务;数据处理;计算机及辅助设备等业务。
成果资料