成果介绍
本发明公开了一种海量医疗数据的快速统计查询方法。首先从不同的数据源收集、过滤和处理医疗数据,保存处理后的医疗数据到分布式文件系统hdfs或者hbase中;针对某个或某些基于统计的医疗数据,利用所述分布式文件系统hdfs或者hbase来创建并初始化统计树;针对新增的医疗数据进行一个或多个增量计算,并用增量计算的结果去更新所述统计树;服务端基于所创建的一个或者多个统计树来响应用户的统计查询请求,将所述统计查询请求解析成基于一个或者多个统计树的子查询,并合并成多个子查询的结果返回给所述用户。该方法可以迅速定位统计数据的位置,避免大数据量的访问,从而减轻了系统负载,提高了查询效率和访问的并发性。
成果亮点
一种海量医疗数据的快速统计查询方法,其特征在于,所述方法包括:从不同的数据源收集、过滤和处理医疗数据,保存处理后的医疗数据到分布式文件系统hdfs或者hbase中;针对某个或某些基于统计的医疗数据,利用所述分布式文件系统hdfs或者hbase来创建并初始化统计树;针对新增的医疗数据进行一个或多个增量计算,并用增量计算的结果去更新所述统计树;服务端基于所创建的一个或者多个统计树来响应用户的统计查询请求,将所述统计查询请求解析成基于一个或者多个统计树的子查询,并合并成多个子查询的结果返回给所述用户;所述利用所述分布式文件系统hdfs或者hbase来创建并初始化统计树,具体包括:利用传统数据库或分布式文件系统hdfs或者hbase来创建统计树,该统计树采用B-树的存储方式,且在所创建的统计树结构中,同层兄弟节点的统计值采用从左至右进行累加的计算方式;借助sqoop工具初始化所创建的统计树,将收集并处理后的医疗数据导入到所创建的统计树中。
团队介绍
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
成果资料
产业化落地方案