一种海量医疗数据的快速统计查询方法
成果类型:: 发明专利
发布时间: 2023-08-04 14:49:52
目前,随着我国经济持续稳定的发展和现代科技的日新月异,人们越来越多的关 注自身健康,在满足日常工作和生活的需求之外,人们也迫切希望通过网络或者手机上网 就能随时查看流行病的季节信息、了解每种疾病下的用药情况以及针对自身疾病获得一些 个性化的推荐服务等。对于公共卫生机构,它们希望各个社区居民的医疗数据能够自动汇 总,并自动对这些数据进行统计分析,统计的结果用来进行流行病的趋势分析和爆发预警, 从而为制定防治干预计划提供有力的参考依据。
由上述本发明提供的技术方案可以看出,首先从不同的数据源收集、过滤和处理 医疗数据,保存处理后的医疗数据到分布式文件系统hdfs或者hbase中;针对某个或某些基 于统计的医疗数据,利用所述分布式文件系统hdfs或者hbase来创建并初始化统计树;针对 新增的医疗数据进行一个或多个增量计算,并用增量计算的结果去更新所述统计树;服务 端基于所创建的一个或者多个统计树来响应用户的统计查询请求,将所述统计查询请求解 析成基于一个或者多个统计树的子查询,并合并成多个子查询的结果返回给所述用户。该 方法可以迅速定位统计数据的位置,避免大数据量的访问,从而减轻了系统负载,提高了查 询效率和访问的并发性。
技术合作
在本实验中,采用了 6台普通服务器搭建了一个hadoop集群的运行环境,每台服务 器16个核,16G的内存,8T的磁盘空间。实验证明,在充分发挥hadoop集群的分布式存储和分 布式计算能力的情况下,模拟1〇〇〇人同时在线的不同类型的统计查询,平均的响应时间在 2s以内。与传统的方法相比,本发明的方法将海量医疗数据的实时统计查询转换为基于统 计树的在线查询,可以在更短的时间内支持更加高并发的统计查询请求。因为是采用增量 计算来进行统计,所以解决了全量计算时系统负载过高的问题。另外,由于数据是冗余存储 的,且hadoop自带了容错机制,因此在系统的高可用性,高稳定性上有着更加明显的优势。
[0071] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此, 任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换, 都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范 围为准。