成果介绍
本发明属于数据处理技术领域,尤其涉及一种分布式极限学习机优化集成框架的系统,包括数据分布存储模块、Stack‑Autoencoder特征提取模块、分布式计算模块和结果输出模块;数据分布存储模块将数据进行分布式存储,并对ELM隐层进行分析和确定;Stack‑Autoencoder特征提取模块对数据进行特征学习,获得压缩化的输入数据,并对输入数据进行归一化处理和特征提取;分布式计算模块根据输入数据进行映射和归约处理得到总体最优权值。本发明对大数据的模式分类更为精确,解决因单层ELM的节点过多造成的过拟合问题使高维矩阵的运算分块并行进行,计算效率得到提高;不用提前将数据读入内存,节省了内存资源。
成果亮点
一种分布式极限学习机优化集成框架系统,其特征在于,包括数据分布存储模块、Stack-Autoencoder特征提取模块、分布式计算模块和结果输出模块:所述数据分布存储模块用于读入训练数据,并根据数据的类型和规模确定隐层数和隐层节点数;同时根据隐层数将数据分割为多个训练子集,并将分割的数据分布到不同的训练子集中进行存储;所述Stack-Autoencoder特征提取模块用于对分布在各个训练子集的训练数据进行特征学习,获得各个训练子集压缩化的输入数据,并对输入数据进行归一化处理和特征提取;所述分布式计算模块用于根据对各个训练子集压缩化输入数据提取的特征和隐层节点数进行映射和归约处理得到总体最优权值;所述结果输出模块用于输出最优权值分析结果;所述数据分布存储模块包括数据采集单元、分布式存储单元和隐层分析单元;其中:所述数据采集单元用于读入训练数据;所述隐层分析单元用于并根据数据的类型和规模,确定ELM隐层数和隐层节点数;所述分布式存储单元用于根据隐层数将数据分割为多个训练子集,同时将分割的数据分布到不同的训练子集中进行存储。
团队介绍
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
成果资料
产业化落地方案