本发明提供一种基于知识图谱的公文搜索方法,其步骤如下:收集数据‑公文语义刻画‑公文图谱刻画‑搜索‑展示。本发明能有效解决“一词多义”或“多词一义”的问题,且能及时更新公开发布的公文,覆盖绝大部分主要发布机构,将其应用于专用领域,搜索结构更精确,更合理。
用传统的文本内容或概念图谱、知识图谱的方式,进行相关公文的展示;文本内容展示用于用户对公文内容的查阅,图谱展示用于展示公文以及相关实体的关联展示。
大数据国家工程研究中心累计投资3亿余元条件建设和科研运行经费,完成科研条件建设,组建了一支330余人的科研团队,其中,专业技术人员271人,博士46人,硕士研究生142人,正高级职称23人,高级工程师55人。同时聘请了陈润生、沈昌祥、王陇德、杨小牛、岳清瑞、王坚等6位院士担任领军专家。
评价单位:“科创中国”贵州科技服务团 (贵州省科学技术协会)
评价时间:2023-11-05
综合评价
经讨论,专家组评价该成果为搜索引擎技术领域,由于传统的搜索方案是基于字词的搜索而公文领域所涉内容广泛,对于公文领域,一般的分词工具难以满足需求,然而从头训练一个适用于公文领域的分词工具需要海量人工标注的语料数据,而公文搜索主要为各公文发布网站自建的搜索引擎服务,这种办法不太适合我们当前的场景。该方法能够有效解决目前搜索领域存在的覆盖面小、适配性差、存在“一词多义”或“多词一义”的理解等问题。
专家组建议在推动该基于知识图谱的公文搜索方法的产业化过程中,从以下几个方面入手。首先,加强与相关领域的合作,与公文发布机构、政府机构等建立合作关系,共同推进该技术在实际应用中的验证和推广。其次,进行大规模的实验和测试,验证该方法在不同领域和数据集上的可行性和性能。此外,还需加强知识图谱的构建和更新,保证搜索结果的时效性和准确性。最后,积极寻求投资和融资支持,为技术的推广和落地提供资金保障。
专家组一致认为该方法有望在公文搜索领域得到广泛应用,并为用户提供更智能化、高效率的公文搜索服务。
查看更多>