本发明公开了一种基于多序列比对的酶序列生成方法、装置、介质和设备。该酶序列生成方法包括:从序列数据库中筛选出与目标酶的完整氨基酸序列相似的若干条相似氨基酸序列;将完整氨基酸序列和若干条相似氨基酸序列进行多序列比对处理,获得若干条对齐氨基酸序列,其中各条对齐氨基酸序列的长度相同;将若干条对齐氨基酸序列作为训练样本对预先构建好的生成式对抗网络模型进行训练,获得氨基酸序列生成模型;利用氨基酸序列生成模型生成目标酶的多条扩展氨基酸序列。通过筛选相似的天然氨基酸序列并进行多序列比对处理,模型可以充分学习到并保留氨基酸序列中的关键位点信息,这样利用模型生成全新的氨基酸序列中具有酶活性的比例更高。
一种基于多序列比对的酶序列生成方法,其特征在于,所述酶序列生成方法包括:
从序列数据库中筛选出与目标酶的完整氨基酸序列相似的若干条相似氨基酸序列;
将所述完整氨基酸序列和若干条所述相似氨基酸序列进行多序列比对处理,获得若干条对齐氨基酸序列,其中各条对齐氨基酸序列的长度相同;
将若干条对齐氨基酸序列作为训练样本对预先构建好的生成式对抗网络模型进行训练,获得氨基酸序列生成模型;
利用所述氨基酸序列生成模型生成所述目标酶的多条扩展氨基酸序列。
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
评价单位:“科创中国”天津中科院先进科技成果技术转移转化专业科技服务团 (天津中科先进技术产业有限公司)
评价时间:2023-11-17
综合评价
本项技术可以达到如下技术效果:通过筛选相似的天然氨基酸序列并进行多序列比对处理,模型可以充分学习到并保留氨基酸序列中的关键位点信息,这样利用模型生成全新的氨基酸序列中具有酶活性的比例更高。
综上所述,该项技术目前居于研发前列,应用市场广阔,具备转移转化价值。
查看更多>