您所在的位置: 成果库 蛋白质功能模块的挖掘方法、计算机设备和存储介质

蛋白质功能模块的挖掘方法、计算机设备和存储介质

成果类型:: 发明专利

发布时间: 2023-11-01 11:57:00

科技成果产业化落地方案
方案提交机构:天津市滨海新区| 宋学姮 | 2023-11-09 16:05:00
本发明公开了一种蛋白质功能模块的挖掘方法、计算机设备和计算机可读存储介质,基于节点级别自适应的图卷积网络(NASGC)模型,通过自适应机制使各个蛋白质节点分别学习高阶和低阶邻居信息,学习得到蛋白质节点的向量表示信息中,在蛋白质节点基因本体属性特征上融合了高阶和低阶的结构信息,得到更加泛化的蛋白质节点表示,由此能够从蛋白质相互作用网络挖掘出蛋白质复合体以及蛋白质信号通路,并且挖掘生成的蛋白质复合体更符合真实情况,提升对于蛋白质功能识别的准确度。
一种蛋白质功能模块的挖掘方法,其特征在于,包括步骤: S1、将蛋白质相互作用网络输入节点级别自适应图卷积网络模型中学习训练,使各个蛋白质节点学习高阶和低阶邻居信息,获得蛋白质节点向量表示; S2、基于所述蛋白质节点向量表示,通过K-means聚类算法进行聚类,得到蛋白质节点的聚类结果软标签,根据所述聚类结果软标签设定损失函数并进行反向传播,更新模型的网络参数; S3、基于以上步骤S1至步骤S2进行迭代计算至模型收敛或达到最大迭代次数,获得最后一次迭代计算的最终的蛋白质节点向量表示以及聚类结果; S4、基于所述最终的蛋白质节点向量表示,通过余弦相似度计算公式计算蛋白质节点的相似度,构建加权邻接矩阵; S5、从所述蛋白质相互作用网络筛选出蛋白质复合体基础结构并基于所述加权邻接矩阵的计算进行扩展,获得蛋白质复合体; S6、从所述聚类结果的每个聚类簇中筛选出蛋白质信号通路基础结构并基于所述加权邻接矩阵的计算进行扩展,获得蛋白质信号通路。

分析蛋白质序列的保守区域和功能特征,可以预测蛋白质中的功能域。功能域是具有特定功能的蛋白质区域,可以通过序列比对、功能注释等方法进行预测。常用的功能域预测工具包括InterPro、CDD等。预测蛋白质的结构域,可以发现蛋白质中的功能模块。结构域是具有特定结构和功能的蛋白质片段,可以通过结构比对、蛋白质结构预测等方法进行识别。常用的结构域数据库包括Pfam、SMART等。

中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生AC态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。

分析蛋白质序列的保守区域和功能特征,可以预测蛋白质中的功能域。功能域是具有特定功能的蛋白质区域,可以通过序列比对、功能注释等方法进行预测。常用的功能域预测工具包括InterPro、CDD等。预测蛋白质的结构域,可以发现蛋白质中的功能模块。结构域是具有特定结构和功能的蛋白质片段,可以通过结构比对、蛋白质结构预测等方法进行识别。常用的结构域数据库包括Pfam、SMART等。

技术转让

蛋白质功能模块的挖掘方法涉及序列比对、结构域识别、功能域预测等技术。计算机设备和存储介质在蛋白质功能模块挖掘中扮演着重要的角色,提供了计算和存储资源的支持。这些方法和设备的应用可以帮助深入理解蛋白质的功能和相互作用,对于生物学和药物研发等领域具有重要的意义。