您所在的位置: 成果库 短序列组装中序列片段的过滤方法及系统

短序列组装中序列片段的过滤方法及系统

发布时间: 2023-07-11

来源: 科技服务团

基本信息

合作方式: 技术服务
成果类型: 发明专利
行业领域:
物理
成果介绍
本发明公开了一种短序列组装中序列片段的过滤方法,包括以下步骤:接收测序序列;分别将接收到的测序序列逐个碱基滑动切割得到固定碱基长度的短串;将得到的所述短串的序列值及所述短串的出现频率存储为一个节点;计算所述短串频率阈值;将频率小于阈值的短串过滤。本发明还提供了短序列组装中序列片段的过滤系统。本发明的有益效果在于,过滤了错误的短串,减小了组装拼接的短串集合,减小了组装拼接程序所需内存,提高了组装拼接程序的性能;在进行短串节点存储的同时对短串出现的频率进行了统计,操作简单;误差小。
成果亮点
1. 一种短序列组装中序列片段的过滤方法,其特征在于,所述方法包括以下步骤: 接收测序序列; 分别将接收到的测序序列逐个碱基滑动切割得到固定碱基长度的短串; 将得到的所述短串的序列值及所述短串的频率存储为一个节点; 计算所述短串频率阈值; 将频率小于阈值的短串过滤; 所述阈值为T = 0XC〇VR,0为分类模型参数,C0VR为测序仪器设定的序列克隆倍数实际 值。 2. 根据权利要求1所述的过滤方法,其特征在于,所述节点采用hash map存储,其中,哈 希键为所述序列值,值为所述节点。 3. 根据权利要求1所述的过滤方法,其特征在于,所述将得到的所述短串的序列值及所 述短串的频率存储为一个节点的步骤具体为: 根据当前节点的短串的序列值在已存储的节点中查询是否已存有当前节点; 如果没有查询到当前节点,则添加所述当前节点; 如果查询到当前节点,则更新所述当前节点的频率。
团队介绍
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
成果资料
产业化落地方案
点击查看
成果综合评价报告

评价单位:“科创中国”天津中科院先进科技成果技术转移转化专业科技服务团 (天津中科先进技术产业有限公司) 评价时间:2023-11-22

王岑

天津中科先进院

项目总监

综合评价

该发明有着过滤了错误的短串,减小组装拼接的短串集合,减小组装拼接程序所需内存,提高组装拼接程序等性能;在进行短串节点存储的同时对短串出现的频率进了统计,操作简单;误差小等优点,在市场拥有良好的前景,并可转化度高,指的推广。
查看更多>
更多