贵州博蕴数据服务有限公司技术需求
价格 双方协商
地区: 贵州省 贵阳市 观山湖区
需求方: 贵州***公司
行业领域
新一代信息技术产业,信息传输、软件和信息技术服务业
需求背景
机器学习算法的训练样本往往具有高度敏感性,模型在训练中会隐式地存储这些敏感的训练数据。因此攻击者通过对模型的分析可能会推断出敏感信息,导致敏感信息泄露。因此,需要在模型训练时保护模型参数与训练数据的隐私。对此,Papernot等提出教师模型全体的隐私聚合(PATE)方法,为了使模型具有鲁棒性及泛化效果通常需要数百个教师模型。由于训练数百个教师模型需要将训练集拆分为数百个不相交的数据子集,因此存在一个难以取舍的问题。当教师模型数量足以对注入的噪声具有鲁棒性时,由于训练数据有限,单个教师模型的预测精度较差。而如果希望每个教师模型的预测精度都高,那么教师模型的数量将很少,集成的输出就容易受到注入噪声的影响。
需解决的主要技术难题
如何在数据量少时,提高教师模型的预测精度。
期望实现的主要技术目标
引入横向联邦学习,联合所有客户端一起训练模型。提高教师模型精确度。
处理进度