目前组学数据的分析方法的行业标准衍生自美国主导的标准(详见市场竞争分析),主要依赖云计算的模式调动大量算力用于组学数据分析,但是由于组学数据规模较大,单个样品就有数十GB,超出了网络传输的合理负荷,为了“上云”代价高昂;引入CPU之外的加速处理器形成的异构计算分析系统才能实现组学大数据的高效精准分析。面向先进计算架构设计组学大数据专用的分析方法,依赖信息技术(IT)和生物技术(BT)的深度融合。
首先是应用形态的变化,组学数据可以实现“当场即时分析”,将原来数日至数周的分析压缩到几小时到几分钟内完成,并且摆脱了对大型计算设备的依赖,可以在数据产生处直接解读生物信息。组学分析将成为包括临床POCT等各类需要生物体高分辨率整体信息应用的基本工具。更重要的是,随着分析规模的上升,人类可以发现并利用更多的生物学规律。
李博士团队长期致力于为组学大数据的通用数据分析提供高性能的计算基础设施和有效算力,团队利用超高技术杠杆撬动组学大数据的高效利用。是全球首个自主研发组学大数据异构计算架构分析系统的团队,利用团队研发的系统在确保准确的前提下实现了超过两个数量级的分析加速,且成本大幅下降。
评价单位:“科创中国”工业互联网产业科技服务团 (中国计算机学会)
评价时间:2022-11-12
综合评价
该跨学科团队拥有组学大数据从产生到应用的全流程经验,可以结合组学大数据的生物学特征建立面向异构计算体系的专用方法,充分挖掘先进计算架构的有效算力。该科研成果领先于已知的主流处理方法,包括数家国际巨头的商业产品,具有广阔的市场发展前景。
查看更多>