您所在的位置: 成果库 一种基于图神经网络自监督聚类的单细胞识别方法及设备

一种基于图神经网络自监督聚类的单细胞识别方法及设备

成果类型:: 发明专利

发布时间: 2023-10-08 11:59:12

科技成果产业化落地方案
方案提交机构:天津市滨海新区| 宋学姮 | 2023-10-11 16:45:04
本发明公开了一种基于图神经网络自监督聚类的单细胞识别方法及设备,所述方法包括:获取不同批次的单细胞,对单细胞进行测序得到细胞基因计数矩阵,将接收到单细胞转录组数据构建细胞‑基因图网络;构建多个细胞子图,并对细胞子图进行合并得到细胞互作图网络;获取细胞互作图网络的低维单细胞测序数据,将低维单细胞测序数据输入到变分自编码器进行处理,并优化得到最优细胞高斯隐变量表征,并进行自监督单细胞聚类以完成单细胞的类型识别。本发明对跨批次的单细胞转录组数据,构建基因‑细胞互作关系网络及细胞表征并进行聚类,从而达到细胞类型的准确识别且针对批次效应、基因缺失等问题实现优化,为单细胞的下游分析精度提供保证。
1.一种基于图神经网络自监督聚类的单细胞识别方法,其特征在于,所述基于图神经网络自监督聚类的单细胞识别方法包括: 获取不同批次的单细胞,对所述单细胞进行测序得到细胞基因计数矩阵,基于所述细胞基因计数矩阵接收单细胞转录组数据,并基于所述单细胞转录组数据构建细胞-基因图网络; 基于所述细胞-基因图网络构建多个细胞子图,并对所述细胞子图进行合并得到单细胞的细胞互作图网络; 获取所述细胞互作图网络的低维单细胞测序数据,将所述低维单细胞测序数据输入到变分自编码器进行处理,得到所述单细胞转录组数据的细胞高斯隐变量表征; 对所述细胞高斯隐变量表征进行优化得到最优细胞高斯隐变量表征,并基于所述最优细胞高斯隐变量表征对单细胞进行自监督单细胞聚类以完成单细胞的类型识别。 2.根据权利要求1所述的基于图神经网络自监督聚类的单细胞识别方法,其特征在于,所述基于所述细胞-基因图网络构建多个细胞子图,并对所述细胞子图进行合并得到单细胞的细胞互作图网络,

在单细胞测序过程中,由于从单个细胞中获得的RNA初始量较低,因此单细胞测序与现有测序方法相比具有高噪声、多零值的特点。与此同时,单细胞测序技术和细胞在生物学上的特征共同产生了大量的噪声,进一步增加了细胞类型识别的难度。此外,实验设计产生的技术噪音引起的批次效应,会混淆样本之间的生物学差异,使下游分析任务复杂化,对下游分析任务的准确性有很大影响,从而导致对分析结果的错误解读。面对单细胞数据缺失值与批次效应特征,现有发技术大多为解单一模块,并未针对聚类进行设计与优化。在数据填补工作中,一些常用方法难以处理严重偏离多元正态分布或非均匀分布的数据。此外,这些方法都依赖于单细胞数据中预先存在的细胞-细胞或基因-基因相关性来计算合理的值。

中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。

本发明中,获取不同批次的单细胞,对所述单细胞进行测序得到细胞基因计数矩阵,基于所述细胞基因计数矩阵接收单细胞转录组数据,并基于所述单细胞转录组数据构建细胞-基因图网络;基于所述细胞-基因图网络构建多个细胞子图,并对所述细胞子图进行合并得到单细胞的细胞互作图网络;获取所述细胞互作图网络的低维单细胞测序数据,将所述低维单细胞测序数据输入到变分自编码器进行处理,得到所述单细胞转录组数据的细胞高斯隐变量表征;对所述细胞高斯隐变量表征进行优化得到最优细胞高斯隐变量表征,并基于所述最优细胞高斯隐变量表征对单细胞进行自监督单细胞聚类以完成单细胞的类型识别。本发明通过针对跨批次的单细胞转录组数据,通过算法模型构建基因-细胞互作关系网络,构建细胞表征并进行聚类,从而达到细胞类型的准确识别且针对批次效应、基因缺失等问题实现优化,为单细胞的下游分析精度提供保证。

技术合作

对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。