您所在的位置: 成果库 基于采样学习的蛋白质-配体绑定位点预测方法

基于采样学习的蛋白质-配体绑定位点预测方法

发布时间: 2022-05-24

来源: 试点城市(园区)

基本信息

合作方式: 技术转让
成果类型: 发明专利,新技术
行业领域:
高端装备制造产业,制造业
成果介绍

本发明提供了一种基于采样学习的蛋白质-配体绑定位点预测方法。首先利用PSI-BLAST与PSIPRED程序获取蛋白质的进化信息和二级结构信息,并使用滑动窗口技术抽取每个氨基酸残基(样本)的特征;其次,利用随机下采样技术,对非绑定位点的样本进行随机下采样,将得到的非绑定位点样本子集与绑定位点样本集训练一个SVM,用于预测所有待预测样本;再次,根据每一个待预测样本的特征信息,利用KNN动态采样学习技术,分别对绑定位点样本与非绑定位点样本进行采样学习,将采样后的绑定位点样本子集与非绑定位点样本子集合并训练一个特定的SVM,用于预测该待预测样本;最后,使用基于阈值的集成技术对训练好的两个SVM进行集成。该方法的优点在于:一是使用随机下采样与KNN动态采样学习技术,可以有效的降低训练集的规模,加快了模型的训练速度;二是使用KNN动态采样学习技术,能针对不同的待预测样本训练不同的SVM模型,有效的融入了待预测样本之间的差异性;三是使用SVM集成技术,有效的降低了采样学习导致的信息丢失,提高模型预测精度。

成果亮点
团队介绍
成果资料