您所在的位置: 成果库 用于安全多方计算的私有数据求交集的方法

用于安全多方计算的私有数据求交集的方法

成果类型:: 发明专利

发布时间: 2022-11-18 09:46:29

科技成果产业化落地方案
方案提交机构:成果发布人| bayuegua123 | 2022-11-18 09:46:29

安全多方计算(SMC)是一组互不信任的参与方之间保护隐私的协同计算问题,两方私有数据求交集是SMC的一个重要研究方向,其中涉及两个参与方P1和P2,拥有数量分别为m1和m2的私有数据集M1和M2,每个参与方在数据保密的情况下计算与另一个参与方的私有数据集的交集。目前,两方私有数据求交集广泛应用于:两个安全机构希望在不透露其他嫌疑人信息的情况下求出嫌疑人名单的交集;两家商业公司想对彼此拥有的客户列表进行交集运算从而进行对应的商业活动,但是不泄漏自己的其他客户信息等等。本项目属于用于安全多方计算的私有数据求交集及验证的方法,包括:被求交集方根据求交集方的私有数据集对应的位数组以及得到该位数组所使用的哈希函数,从自己的私有数据集中过滤出第一集合;求交集方根据被求交集方的私有数据集对应的位数组以及得到被求交集方的私有数据集对应的位数组所使用的哈希函数,从自己的私有数据集中过滤出第二集合;求交集方根据第一集合对应的位数组以及得到第一集合对应的位数组所使用的哈希函数,从自己的私有数据集中过滤出第三集合,作为参与双方私有数据集的交集;以及,根据所述第二集合和第三集合判断被求交集方是否存在作假行为。

现有的两方私有数据求交集的方法主要利用了Bloom Filter(即布隆过滤器)技术,方法包括:想要计算私有数据交集的参与方请求对方的Bloom Filter,对方通过加密通信等方式发送其Bloom Filter,想要计算私有数据交集的参与方利用对方的Bloom Filter过滤自己的私有数据集,从而得出与对方私有数据的交集。其中,每次计算交集都需要求交集方发送请求并且需要被求交集方返回其Bloom Filter,这导致数据传输冗余;在求交集时仅进行一次过滤,得到的粗略交集误差比较大,影响了结果的准确性,并且可能削弱参与双方的信任程度以及合作的利益关系;此外,求交集方无法对被求交集方提供的数据的真实性进行验证,这样也会影响结果的准确性。本项目提供一种用于安全多方计算的私有数据求交集的方法,其中参与双方为求交集方和被求交集方,能够完善的解决技术中存在的缺陷

随着数字经济时代的到来,数据已成为一种基础性资源。然而,数据的泄露、滥用或非法传播均会导致严重的安全问题。因此,对数据进行隐私保护是现实需要,也是法律要求。隐私集合求交(Private Set Intersection, PSI)作为解决数据隐私保护的方案之一,受到广泛关注和研究。

隐私集合求交使得持有数据参与方通过计算得到集合的交集数据,而不泄露任何交集以外的数据信息。作为安全多方计算中的一个重要分支,其不仅具有重要的理论意义,也具有广泛的应用场景。例如:隐私保护位置共享、在线广告的有效转换率衡量以及基于人类基因组序列的亲子鉴定、疾病预测和血统测试等。

1计算广告的实际效果,线上广告是一种重要的广告形式。对于广告的有效程度的衡量的常见方法是计算所谓的转换率,也就是浏览广告的用户中有多少用户最终浏览了相应的商品页面,或是最终购买了相应的商品或是服务。一种通用的计算方法是由计算浏览广告的用户信息(由广告发送方占有)和完成相应交易的用户信息(由商家占有)的交集来计算(如计算交易总额或是总交易量等);

2寻找联系人

当一个用户注册使用一种新的服务(如微信、Whatsapp 等)的时候,从用户的现有联系人中寻找有哪些已经注册了同类的服务是一种在大多数情况下十分必要的操作。通过将用户的联系人发送给服务提供商可以有效地完成这项功能,但是与此同时用户的联系人信息,一种在大多数情况下被认为是隐私的信息,也被暴露给服务提供商了。因此在这种场景下,将用户的联系人信息作为一方的输入,将服务提供商的所有用户信息作为另一方的输入来进行PSI 协议可以完成发现联系人的功能,而且可以防止交集以外的信息泄露给任何一方;

3联邦学习样本对齐

在联邦学习发起训练之前,必须基于双方的数据进行PSI,使用双方共有的用户信息(例如用户ID)找出交集,从而对应两方数据的特征和标签,在对齐的数据集上进行模型训练才有意义。

孙毅  男  博导  中国科学院计算技术研究所研究领域 区块链、分布式应用李军 男 硕导 计算技术研究所研究领域 分布式总账(区块链)“区块链”是基于分布式系统和密码学而形成的概念与技术的集合,属于一种网络信任技术(Networked Trust Tech)。区块链系统采用多中心的分布式部署方式,无单一中心控制,平等地协作完成数据验证和一致性存储。每个中心的数据记录以及与之关联的执行代码 (或脚本,Script)在逻辑上存储在区块(Block)中,这些块又在逻辑上顺序串联起来构成链条(Chain),其中应用了数字签名等密码学技术保证数据的真实性、实时性与时序性。因此在应用场景上能够以技术建立参与方之间端到端的信任,是可被广泛应用的FinTech。能够完善的克服现有P2P网络中对于P2SP架构的索引服务不完善并且网络系统安全性差的缺陷。

1.在求得粗略交集的基础上进一步计算精确交集,提高了求交集结果的准确性;

2.利用区块链技术,求交集方可以从区块链上直接获取被求交集方的BloomFilter等数据,解决了数据传输冗余的问题,降低了参与双方多次通信带来的开销,同时降低了数据在传输过程中被篡改、重播等风险,从而使得求交集过程更加安全和高效;

3.项目提供了一种新的Challenge协议,结合区块链技术,在不泄露原始数据的同时实现了数据真实性的验证;此外,利用区块链技术对作假方进行惩罚,有利于减少参与双方的作假行为。

技术许可、技术转让;寻求资源对接,最好有明确的目标合作区域、目标合作领域、目标合作企业等;目标合作投融资机构等