本发明提供了一种衡量公文相似性的方法,包括以下步骤:构建本体知识库‑B公文文本预处理‑计算四类信息的相似性‑计算公文剩余内容的相似性‑公文相似性。本发明获取的公文相似性,可被用于公文的检索,搜索,推荐,能提高公务员日常工作的便利,且利用了最新的本体知识库方法来计算公文相似性,相比传统经典算法,如doc2vec,LDA,计算精确度更高。
本发明提供了一种衡量公文相似性的方法,该衡量公文相似性的方法利用了最新的本体知识库方法来计算公文相似性,相比传统经典算法,如doc2vec,LDA,计算精确度更高。
大数据国家工程研究中心累计投资3亿余元条件建设和科研运行经费,完成科研条件建设,组建了一支330余人的科研团队,其中,专业技术人员271人,博士46人,硕士研究生142人,正高级职称23人,高级工程师55人。同时聘请了陈润生、沈昌祥、王陇德、杨小牛、岳清瑞、王坚等6位院士担任领军专家。
评价单位:“科创中国”贵州科技服务团 (贵州省科学技术协会)
评价时间:2023-11-04
综合评价
经过细致的技术审查和深入的讨论,专家组对这种一种衡量公文相似性的方法给予了高度的认可。该方法在解决市民和公务员寻找相关公文显现出卓越的技术优势。特别是计算海量跨地区跨单位文章文档的能力,方法应能够在短时间内对大量公文进行相似性计算以提高工作效率。该方法采用最新的本体知识库方法为用户提供了深度、即时的数据洞察,这在许多关键决策场景中具有不可估量的价值。同时,具备良好的可扩展性,能够适应不同规模和类型的公文数据。方法应能够灵活地处理不同的公文格式和语言,以满足不同需求。但也有专家提出,方法应考虑到公文的敏感性和隐私性,采取相应的数据安全措施,确保公文数据的安全和隐私不被泄露。此外如果该方法与现有公文处理系统能够方便集成,可以作为增值服务提供给现有用户,有助于推广和应用。
查看更多>