成果介绍
本发明涉及一种构建决策树分类器的方法,包括:获取样本数据;构建包含多个子决策树的随机森林分类器;获取所述多个子决策树的节点的分裂属性的出现频率,根据所述出现频率将所述多个子决策树合并成主决策树,且所述主决策树的叶节点对应类标集和叶属性类标签,所述叶属性标签为所述类标集中出现频率最高的类标签;根据所述叶属性类标签合并所述主决策树的叶节点;根据所述主决策树生成决策树分类器。此外,还包括一种构建决策树分类器的装置。上述构建决策树分类器的方法及装置可以提高分类速度。
成果亮点
一种基于决策树分类器的数据分类的方法,包括:获取样本数据;构建包含多个子决策树的随机森林分类器;获取所述多个子决策树的根节点的分裂属性,获取所述根节点的分裂属性的出现频率,根据所述出现频率最大的分裂属性生成主决策树的目标分支节点,且所述主决策树的叶节点对应类标集和叶属性类标签,所述叶属性类标签为所述类标集中出现频率最高的类标签;判断所述目标分支节点的分裂属性是否为数值属性,若是,则获取所述多个子决策树的根节点中分裂属性为数值属性的节点的分裂值,并根据所述分裂值生成所述目标分支节点的子分支节点,移除所述多个子决策树的根节点中分裂属性为数值属性的节点;否则,获取所述多个子决策树的根节点中分裂属性为类别属性的节点的类别取值,并根据所述类别取值生成所述目标分支节点的子分支节点,移除所述多个子决策树的根节点中分裂属性为类别属性的节点;遍历所述主决策树,将所述叶属性类标签相同的所述叶节点缩减为同一个叶节点
团队介绍
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
成果资料
产业化落地方案