您所在的位置: 成果库 一种基于深度卷积生成对抗网络的多类别多视图数据生成方法

一种基于深度卷积生成对抗网络的多类别多视图数据生成方法

成果类型:: 发明专利

发布时间: 2024-10-14 08:43:21

科技成果产业化落地方案
方案提交机构:成果发布人| 徐景新 | 2024-10-14 08:43:21

为了克服现有的图像数据生成方式在多类别多视图数据场合的数量不大、采集成本较高的不足,为了实现多视图数据的生成,同时,针对不同的类别又能生成类似于该类别的数据,本发明提出了一种基于深度卷积生成对抗网络(DC-GAN)的多类别多视图数据生成方法。由于数据集的限制,本发明特别针对珍珠图像的生成,但其核心方法可以推广到其他数据。

一种基于深度卷积生成对抗网络的多类别多视图数据生成方法,包括如下步骤:1.中心剪裁图片,2.在通道维度叠合多视图。3.提取多视图类别标签。4.用叠合多视图、类别标签、外加随机高维噪声共同训练DC‑GAN网络。5.用高维随机噪声和自定义标签传入训练好的网络,生成多视图叠合数据。6.剪裁并填充背景,得到符合原尺寸的多视图。本发明所述方法通过多视图叠合和带标签训练生成对抗网络的方法,实现了只需修改输入即可通过一个模型生成不同类别多视图的功能,所生成的数据可作为训练数据的扩充,来增加训练数据的多样性。

一种基于深度卷积生成对抗网络的多类别多视图数据生成方法 的应用前景

基于深度卷积生成对抗网络的多类别多视图数据生成方法具有广泛的应用前景,以下是一些可能的应用领域:

数据增强:在训练机器学习模型时,该方法可以生成更多的样本,从而丰富数据集,提高模型的泛化能力。

虚拟现实和增强现实:通过生成多视图数据,可以为虚拟现实和增强现实应用提供更加真实和丰富的场景。

图像和视频处理:这种方法可以用于图像和视频的生成、修复、风格转换等任务,为多媒体内容创作提供新的手段。

医学影像:在医学影像领域,该方法可以生成模拟的医学图像,帮助医生进行培训和研究。

安全领域:多类别多视图数据生成可以用于模拟不同场景,为安全监控和风险评估提供数据支持。

数据隐私保护:通过生成类似真实数据的合成数据,可以在不泄露原始数据的情况下进行数据分析和模型训练。

浙江工业大学是东部沿海地区第一所省部共建高校、首批国家“高等学校创新能力提升计划”(2011计划)协同创新中心牵头高校和浙江省首批重点建设高校,坐落于中国历史文化名城、风景旅游胜地杭州。学校坚持立德树人根本任务,以拔尖创新人才为引领、高级应用型人才为主体、复合型人才为特色,大力培养德智体美劳全面发展,富有家国情怀、国际视野、创新精神和实践能力的行业精英和领军人才。

具体来说,本发明所述的方法具有如下的有益效果:

(1)在多视图组合输入时,由于总维度过大,通常需要构建节点量很大的神经网络,这在内存占用和计算上很不友好,本发明所述的方法通过中心剪裁和通道叠合,在不损害物体像完整的前提下,尽可能缩减了节点量,还排除了部分背景的干扰。

(2)相比于长宽维度的平铺,本发明所述的方法选择在通道维度叠合多视图,除了能使输入形状规范,不用为了补足尺寸而添加像素点外,还能充分利用卷积操作将各视图的特征关联起来。使各个视图间的联系更为紧密。

(3)本发明所述的方法将标签数据添加到神经网络的输入和每个中间层数据中,使得神经网络的每一层都能受到标签信息的约束,较好地限制了生成对抗网络太过自由的特点,达到了用一个网络就能生成多种类别数据的效果。

技术转让,许可,合作所需资金需双方协商,此项技术想尽快落地,希望具备此项技术研发的技术方,能够尽快承接此项目。