您所在的位置: 成果库 基于多序列比对的酶序列生成方法、装置、介质和设备

基于多序列比对的酶序列生成方法、装置、介质和设备

成果类型:: 发明专利

发布时间: 2023-10-20 16:20:13

科技成果产业化落地方案
方案提交机构:天津市滨海新区| 宋学姮 | 2023-10-31 16:45:59
本发明公开了一种基于多序列比对的酶序列生成方法、装置、介质和设备。该酶序列生成方法包括:从序列数据库中筛选出与目标酶的完整氨基酸序列相似的若干条相似氨基酸序列;将完整氨基酸序列和若干条相似氨基酸序列进行多序列比对处理,获得若干条对齐氨基酸序列,其中各条对齐氨基酸序列的长度相同;将若干条对齐氨基酸序列作为训练样本对预先构建好的生成式对抗网络模型进行训练,获得氨基酸序列生成模型;利用氨基酸序列生成模型生成目标酶的多条扩展氨基酸序列。通过筛选相似的天然氨基酸序列并进行多序列比对处理,模型可以充分学习到并保留氨基酸序列中的关键位点信息,这样利用模型生成全新的氨基酸序列中具有酶活性的比例更高。
一种基于多序列比对的酶序列生成方法,其特征在于,所述酶序列生成方法包括: 从序列数据库中筛选出与目标酶的完整氨基酸序列相似的若干条相似氨基酸序列; 将所述完整氨基酸序列和若干条所述相似氨基酸序列进行多序列比对处理,获得若干条对齐氨基酸序列,其中各条对齐氨基酸序列的长度相同; 将若干条对齐氨基酸序列作为训练样本对预先构建好的生成式对抗网络模型进行训练,获得氨基酸序列生成模型; 利用所述氨基酸序列生成模型生成所述目标酶的多条扩展氨基酸序列。

酶在生物催化、化工领域有着重要的应用,而由于天然酶存在的数量有限,限制了下游真实场景的工业应用。而众所周知,酶的功能由结构决定,酶的结构则本质上由一级序列决定,因此为了更有效的探索酶功能的空间,需要我们对天然酶的序列进行拓宽。除了传统的实验方法,例如定向进化和理性设计对酶进行改造外,随着机器学习、深度学习等方法的发展,基于计算的方法对酶进行改造也成为了另一类重要的研究方案。代表性的是基于生成式对抗网络的酶序列生成方法,该方法已经证明了可以有效的拓宽有效的酶序列空间,但是该方法在样本较少,即少序列生成时效果仍然不好,如关键位点的丢失,造成生成的氨基酸序列中有酶活性序列的比例较低。

中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。

本申请还公开了一种计算机可读存储介质,所述计算机可读存储介质存储有基于多序列比对的酶序列生成程序,所述基于多序列比对的酶序列生成程序被处理器执行时实现上述的基于多序列比对的酶序列生成方法。

本申请还公开了一种计算机设备,所述计算机设备包括计算机可读存储介质、处理器和存储在所述计算机可读存储介质中的基于多序列比对的酶序列生成程序,所述基于多序列比对的酶序列生成程序被处理器执行时实现上述的基于多序列比对的酶序列生成方法。

本发明公开的一种基于多序列比对的酶序列生成方法、生成装置,相对于现有技术,具有如下技术效果:

通过筛选相似的天然氨基酸序列并进行多序列比对处理,模型可以充分学习到并保留氨基酸序列中的关键位点信息,这样利用模型生成全新的氨基酸序列中具有酶活性的比例更高。

技术合作

本领域技术人员应该理解,在不脱离由权利要求及其等同物限定其范围的本发明的原理和精神的情况下,可以对这些实施例进行修改和完善,这些修改和完善也应在本发明的保护范围内。