成果介绍
本发明提出了一种应用架构查重方法、系统、终端及存储介质,专注于解决电力公司开发应用产品时面临的重复开发问题。通过采集应用架构的描述文本,利用OCR文字识别技术提取文字内容,并进一步提取关键分词特征进行数据库保存。系统能够计算目标描述文本与数据库中其他文本的相似度,筛选出相似度达到设定阈值的文本作为相似文本输出。该方法有效降低了海量数据中的查重工作量,提高了查重效率和准确度,为电力公司优化资源配置、避免重复开发提供了有力支持。该成果不仅适用于电力公司,也可广泛应用于其他需要文本查重的领域。
成果亮点
本发明的亮点在于其创新性和实用性。通过结合OCR文字识别技术和自然语言处理技术,实现了对应用架构描述文本的自动化处理,大大提高了查重效率。采用基于关键分词特征的相似度计算方法,有效缩小了查重范围,提高了查重准确度。此外,系统支持自定义相似度阈值,满足不同场景下的查重需求。最后该发明解决了电力公司长期存在的重复开发问题,为企业节省了大量资源和成本,提升了整体运营效率。
团队介绍
本发明由北京国网信通埃森哲信息技术有限公司与国网思极数字科技(北京)有限公司联合研发,团队成员来自信息技术、自然语言处理、项目管理等多个领域,具备深厚的专业背景和丰富的实践经验。核心成员在电力系统应用开发、自然语言处理、大数据分析等方面具有卓越的能力。通过成员紧密合作,充分发挥各自的专业优势,共同攻克了应用架构查重中的多项技术难题,为电力公司的数字化转型和高效运营提供了有力支持。
成果资料