成果介绍
本发明公开了一种蛋白质功能模块的挖掘方法、计算机设备和计算机可读存储介质,基于节点级别自适应的图卷积网络(NASGC)模型,通过自适应机制使各个蛋白质节点分别学习高阶和低阶邻居信息,学习得到蛋白质节点的向量表示信息中,在蛋白质节点基因本体属性特征上融合了高阶和低阶的结构信息,得到更加泛化的蛋白质节点表示,由此能够从蛋白质相互作用网络挖掘出蛋白质复合体以及蛋白质信号通路,并且挖掘生成的蛋白质复合体更符合真实情况,提升对于蛋白质功能识别的准确度。
成果亮点
一种蛋白质功能模块的挖掘方法,其特征在于,包括步骤:
S1、将蛋白质相互作用网络输入节点级别自适应图卷积网络模型中学习训练,使各个蛋白质节点学习高阶和低阶邻居信息,获得蛋白质节点向量表示;
S2、基于所述蛋白质节点向量表示,通过K-means聚类算法进行聚类,得到蛋白质节点的聚类结果软标签,根据所述聚类结果软标签设定损失函数并进行反向传播,更新模型的网络参数;
S3、基于以上步骤S1至步骤S2进行迭代计算至模型收敛或达到最大迭代次数,获得最后一次迭代计算的最终的蛋白质节点向量表示以及聚类结果;
S4、基于所述最终的蛋白质节点向量表示,通过余弦相似度计算公式计算蛋白质节点的相似度,构建加权邻接矩阵;
S5、从所述蛋白质相互作用网络筛选出蛋白质复合体基础结构并基于所述加权邻接矩阵的计算进行扩展,获得蛋白质复合体;
S6、从所述聚类结果的每个聚类簇中筛选出蛋白质信号通路基础结构并基于所述加权邻接矩阵的计算进行扩展,获得蛋白质信号通路。
团队介绍
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生AC态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
成果资料
产业化落地方案