成果介绍
根据文献类文字检测与识别训练系统(二期)的实际需求,分析并开发民国文献报纸OCR检测识别的模型训练系统,提高人工处理文字的效率。开发报纸版面标注工具,可生成报纸版面结构化数据。在文字检测识别上,提供API调用,保证其可用性与及时性。且通过校对后的文
字数据不定时迭代更新模型,提高识别正确率。提供任务管理和监控界
面,维护后台运作的稳定,必要的技术问题需及时修复。
文献类文字检测与识别训练系统(二期)包含以下五个子系统:
一、标注系统:标注报纸标题、正文、作者、段落顺序等区域。
二、段落内文字顺序重组、漏字二次识别模块。
三、识别模型:文字检测和文字识别模型。
四、识别任务调度与监控系统。
五、识别训练系统
成果亮点
发明将获取的图像进行RGB三原色分解,并对每个原色图像的识别结果通过两重回归分析进行深度学习,生成三原色的特征识别模型,并通过不断的迭代训练对模型进行更新,不断优化更新更新三原色回归分析方程,从而达到最优的识别效果。利用本发明能够大大提高彩色图像的识别准确率,对对特征多样和非常见类型的图像识别准确率有明显改善,能够广泛应用于特征多样和非常见类型的图像多的农业病虫害识别等领域。
团队介绍
福州大学是国家“双一流”建设高校、国家“211工程”重点建设大学、福建省人民政府与国家教育部共建高校。学校创建于1958年,现已发展成为一所以工为主、理工结合,理、工、经、管、文、法、艺等多学科协调发展的重点大学。近年来,福州大学坚持“四个面向”,围绕学校“双一流”建设,开启新一轮有深度、有广度、有温度的校地合作,有规划地搭建校地校企“朋友圈”,有组织地开展政产学研合作,跑出科技创新与成果转移转化的加速度,加快科研成果从样品到产品再到商品的转化,把科技成果充分应用到现代化事业中去。
成果资料