超级计算与云计算环境下大数据安全隐私计算控制方法
成果类型:: 发明专利
发布时间: 2023-09-27 12:47:03
本发明涉及超级计算与云计算环境下大数据安全隐私计算控制方法,通过样例数据规则对原始数据进行数据保护级别判定,对于判定后的原始数据生成系统对其进行脱敏采集,并生成样例数据;同时加密传输到安全存储系统中;若数据应用方需求使用数据,则需向数据管理员进行请求,数据管理员需对请求进行审批;审批过后数据应用方样例数据在算法调试系统中进行调试,并生成算法模型;最终将算法模型输入至计算任务执行系统云计算环境中,进行可信计算,数据应用方得到计算结果数据。
级计算与云计算环境下大数据安全隐私计算控制方法,包括以下步骤:步骤1、数据管理员根据样例数据规则对原始数据进行数据保护级别判定;步骤2、通过步骤1判定的数据保护级别并且根据样例数据生成系统对原始数据进行脱敏采集,并生成样例数据;步骤3、将步骤2生成的样例数据加密并传输到安全存储系统中;本步骤的具体方法为:样例数据通过的SSL或TLS安全隧道的方式加密传输至安全存储系统中,同时将原始数据的指纹信息写入区块链,并记录原始数据的特征码;步骤4、数据应用方向数据管理员进行请求,数据管理员对请求进行审批;步骤5、数据应用方对步骤3中的样例数据在算法调试系统中进行调试,并生成算法模型;本步骤的具体方法为:数据应用方在使用样例数据前,先从区块链上获取数据的指纹信息并与要使用的数据进行比对,若对比数据完整,则数据应用方使用解密秘钥对样例数据进行解密,并在算法调试系统中进行调试,并生成算法模型,否则样例数据不能使用;步骤6、数据应用方将步骤4中得到的算法模型输入至超级计算任务执行系统云计算环境中,计算任务执行系统进行可信计算并将计算结果传送至数据应用方;步骤6.1、将步骤4中得到的算法模型输入至计算任务执行系统云计算环境中,计算任务执行系统云计算环境根据超级计算机和云计算环境的可用资源量,数据量和算法复杂程度预期进行计算环境的选择;步骤6.2、在计算任务执行系统云计算环境进行可信计算,并得到计算结果数据同时进行加密;步骤6.3、数据应用方根据需求填写结果数据申请表,并发送至数据管理员;步骤6.4、数据管理员对数据应用方的需求进行审核,若审核通过则进行步骤6.5,否则返回步骤6.3,数据应用方重新根据需求填写结果数据申请表;步骤6.5、数据所有方对数据应用方的需求进行审核,若审核通过则进行向数据应用方发送计算结果数据的解密秘钥,同时数据应用方获取计算结果数据,否则返回步骤6.3;其中,步骤2中的样例数据生成系统、步骤4的算法调试系统和步骤5的计算任务执行系统云计算环境位于虚拟化隔离环境中,原始数据、样例数据、算法模型和计算结果数据位于数据存储系统中。
随着信息时代的蓬勃发展,信息化产生了越来越多的各样式的数据,如针对患者采集到的健康数据、使用智能设备的浏览数据、电子监控设备采集到的人员未知图像等数据;目前这些数据存储在各个数据采集者的环境中,由于数据包含了大量的用户隐私信息既无法共享又无法统筹的使用,从而使数据产生最大化的价值。
期望的一种数据使用方式是:提供一个数据交易平台,不同的数据提供方将数据加密存储到一个集中的系统后,该系统可以提供某种方法既保证数据的安全性、完整性,又能够确保数据对其它参与方不可见,参与方只能够在授权的条件下使用数据进行基于某个算法的计算且无法拿到任何的原始数据。
从数据的安全和完整性来说:现有技术中,通常对数据的传输进行加密,但是对传输过后集中存储的数据缺乏使用时的完整性验证,使用数据的用户无法得知正在使用的数据是否是真实的还是被篡改过的;
从算法的调试来说:现有的技术通常基于一个通用的平台进行算法的调试,在算法调试过程中参与方即可通过调试的方式拿到原始的数据,如在算法中将原始数据直接输出到命令行窗口或者写入到某个文件等;这个做法无法保证原始数据的安全。
从整个计算过程来说:现有的技术通常在一个共享的环境中进行算法的执行,如果在算法代码里直接对原始数据进行输出,将会导致原始数据的泄露;同时由于数据量的不断快速增长,普通的算力难以满足计算需求。
本专利可解决以上问题。
本发明提出超级计算与云计算环境下大数据安全隐私计算控制方法,从数据采集、数据存储、区块链隐私保护、算法调试和可信计算环境实现基于超级计算与云计算融合的大数据安全隐私计算,能够确保采集上来的数据不会被篡改:通过与区块链上的数据指纹信息进行比对,确保每次参与计算的都是真实未经篡改的数据。
该成果拟通过技术开发、技术许可等方式进行转化。