一种不平衡数据下的多任务植物生化参量反演方法及系统

发布时间: 2022-11-30

基本信息

合作方式：技术服务

成果类型：发明专利

行业领域：

电子信息技术

成果介绍

一种不平衡数据下的多任务植物生化参量反演方法及系统，涉及植物叶片物化参量反演技术领域，用以解决现有技术中由于叶片数据样本不平衡、对多个反演参量任务模型特征利用率低而导致的参量反演结果不准确的问题。本发明的技术要点包括：输入端对多维数据标签预处理，控制不同任务的损失比重相似；构建卷积神经网络，不同反演任务共享底层的特征提取层，输出端使用平衡均方误差作为损失函数，对任务损失使用自适应加权，完成模型训练。本发明考虑到了植物物化参量间的相关性，使用多任务模型降低了模型参数的冗余度，并且能够规避实测数据不平衡导致的对丰富样本的过度表示和对稀缺样本的忽略，提升了多维不平衡数据整体的预测准确度。

成果亮点

本发明通过引入平衡均方误差函数(Balanced Mean Square Error,BMSE)解决训练过程中不平衡数据集的影响，以及引入多任务学习模型和自适应损失权重分配提高模型复用能力，综合提出一种对不平衡叶片光谱数据多任务并行的反演方法。与传统反演方法相比，本发明由于采用了平衡误差损失函数，充分考虑到了叶片样本采样成本限制导致的样本数据集的标签分布不平衡现象，减轻了特征学习过程中模型对丰富数据的过度表示和对稀缺数据的忽略问题，从而得出更为合理的决策边界；采用了多任务卷积网络作为反演模型，充分利用了参量间特征的相关性，以硬共享的方式共享底层特征提取层，实现不同参量反演任务模型的耦合和信息共享，相比单任务反演模型明显降低了模型参数量和训练时间；同时，为解决多任务间学习速率不一致的问题，还采用了自适应损失权重分配方法，在模型训练过程当中对任务的重要性进行动态分配，不需要人工重复实验设置超参数，既避免了人工分配权重的繁琐性和随机性，又可以保持多个反演任务学习速率相似，提升了多任务模型的精度。

团队介绍

材料科学与化学工程学院现有教职工170人，其中新世纪百千万人才工程国家级人选1人，教育部新世纪人才1人，全国优秀教师1人，龙江学者3人，省杰青4人，省思政名师1人，省级教学师德标兵4人，黑龙江省研究生优秀导师团队2个，博士生导师25人，硕士生导师106人。

成果资料