基于流形学习与闭环深度卷积双网络模型的基因特征提取方法
成果类型:: 发明专利
发布时间: 2024-10-23 08:51:46
为了克服已有基因特征提取方法的降维速度较慢、无法最大程度保留基因特 征的不足,本发明提供一种最大程度保留基因特征并实现快速降维的基于流形学 习与闭环深度卷积双网络模型的基因特征提取方法。
一种基于流形学习与闭环深度卷积双网络模型的基因特征提取方法,包括以下步骤:第一步,基于流形学习的癌症关联基因特征粗提取,第二步,基于闭环深度卷积双网络结构的基因特征精细提取,过程如下:采用正向卷积神经网络和反向卷积神经网络相结合的双网络结构,利用卷积神经网络的特征提取能力对基因表达数据集进行深度抽象,最终投影出关键特征;反向卷积神经网络实现关键特征的逆投影。本发明提供一种最大程度保留基因特征并实现快速降维的基于流形学习与闭环深度卷积双网络模型的基因特征提取方法。
生物医学研究 - 疾病诊断和基因治疗方面
疾病诊断标志物发现:在疾病研究中,该基因特征提取方法可以帮助挖掘疾病相关的基因特征。例如,在癌症研究中,通过对癌症患者和健康人群的基因数据进行分析,提取具有诊断价值的基因特征,作为癌症早期诊断的标志物。这些标志物可以用于开发更精准的诊断试剂盒,提高癌症的早期发现率。
基因治疗靶点确定:对于基因治疗领域,准确的基因特征提取是关键。通过这种方法,可以识别出与疾病发生发展密切相关的基因靶点。例如,在某些遗传性疾病的治疗中,找到关键的致病基因及其特征,为设计基因治疗方案(如基因编辑、基因沉默等)提供依据,有望实现对这些疾病的精准治疗。
药物研发领域 - 药物靶点筛选和药物疗效预测方面
药物靶点筛选:在新药研发过程中,需要寻找合适的药物靶点。该基因特征提取方法可以从大量的基因数据中筛选出与药物作用相关的基因特征,帮助药物研发人员确定潜在的药物靶点。例如,在抗糖尿病药物研发中,通过分析糖尿病相关基因的特征,找到可以调节血糖代谢的基因靶点,为药物设计提供方向。
药物疗效预测:通过对患者基因特征的提取和分析,还可以预测药物在个体中的疗效。不同患者由于基因差异,对药物的反应可能不同。利用这种方法,可以提前评估患者对药物的反应情况,实现个性化的药物治疗方案制定,提高药物治疗的有效性。
浙江工业大学是东部沿海地区第一所省部共建高校、首批国家“高等学校创新能力提升计划”(2011计划)协同创新中心牵头高校和浙江省首批重点建设高校,坐落于中国历史文化名城、风景旅游胜地杭州。学校坚持立德树人根本任务,以拔尖创新人才为引领、高级应用型人才为主体、复合型人才为特色,大力培养德智体美劳全面发展,富有家国情怀、国际视野、创新精神和实践能力的行业精英和领军人才。
本发明的技术构思为:相比浅层机器学习算法,卷积神经网络能自动学习过 滤核并抽象出数据的潜在特征。凭借其卓越的特征提取能力,CNN已经被大规模 用于图像处理和分类领域,在基因表达数据的特征提取方面尚无太多应用。传统 CNN采用线性卷积核,线性模型的局限在于抽象能力低,无法完全提取出数据的 局部特征。Lin等提出NIN模型,在传统过滤核的基础上添加了双层神经网络,从 而将线性映射转化为非线性,提高了信息局部抽象能力。但因为采用ReLU激活函 数,在训练过程中置0区域的神经元将会阻碍梯度的传导。针对这个问题,Chang 等人在NIN模型的基础上提出MNIN(Maxout Network inNetwork)模型,利用 Maxout强大的拟合能力来取代ReLU,同时利用批标准化对每层过滤核的输出进 行标准化,降低了饱和程度。
人体的基因表达包含有约22000个基因,如何从中提取出某种癌症强关联的基因特征?把原始的高维基因表达数据的“维度灾难”通过一种有效的降维方法投映 到低维的空间,从而提取我们所需要的与癌症相关的低维特征信息。本发明拟采 用基因特征粗提取与精细捕捉相结合的方法进行提取,框架示意图如图1所示。
本发明的有益效果主要表现在:最大程度保留基因特征并实现快速降维。
技术转让,许可,合作所需资金需双方协商,此项技术想尽快落地,希望具备此项技术研发的技术方,能够尽快承接此项目。