数据要素流通技术体系
成果类型:: 新技术
发布时间: 2022-10-26 11:11:59
为解决数据流通中产生的数据隐私泄露、数据主权被侵犯、数据传输不安全等问题,天翼电子商务有限公司(下称“翼支付”)遵循“数据可用不可见”的原则进行数据要素流通技术体系的探索和自主研发,本体系以数据治理、数据共享、数据开放、数据安全等数据资源规范管理为目标,建设具有全生命周期管理的一体化服务平台。数据治理层主要实现数据接入、数据存储和数据加工;数据开放共享层以区块链和隐私计算为技术底座,在确保数据主权的前提下开放共享,实现数据要素合规流通与价值释放。本体系通过了信通院、BCTC、TBI等多个权威机构专项产品测评,同时承担了集团内外多个重点业务场景落地,积极推进了政府、金融、运营商等多行业间数据互联互通。
数据要素流通技术体系创新性的引入了“区块链+隐私计算”双引擎技术架构,数据通过数据治理后,由隐私计算引擎为数据隐私保护提供安全技术保障,区块链则确保核心计算逻辑与业务逻辑的高可信与不可篡改。数据要素流通技术体系在苏州人行牵头的苏州城市金融反诈反洗钱平台项目中得到落地应用,满足黑灰名单共享、一人多卡、反洗钱、精准阻诈、实时追溯等多种业务需求,同时为人行、公安提供实时高效的金融监管与审查能力。平台优异的数据治理与数据安全表现获得了监管机构和金融机构的认可。本体系构建了可信任可监管的底层数据流通环境,对于打破数据孤岛,促进数据资源开放利用,助力政府间、政企间和企业间安全高效的数据协作具有标杆意义。
翼支付数据要素流通技术体系在保证数据质量可靠、数据内容可信的基础上,实现数据安全、合规、合理的有效使用。
隐私计算可以保障数据端到端的隐私性。采用自主构建的核心密码算法组件,通过对交互的标签、特征、梯度等数据进行诸如同态加密、秘密分享等密码学处理,可以在保证密文接收方或外部第三方多项式时间内无法恢复明文的基础上直接基于密文进行计算并获得正确的计算结果,从而达到各参与方无需共享数据资源即可实现数据联合训练并输出共享的机器学习模型的目的。
区块链可以保障隐私计算过程的可追溯性。数据申请、授权、任务调度、计算结果全过程链上进行记录与存储,链上记录的信息可通过其它参与方对数据进行签名确认的方式,进一步提高数据可信度,同时可通过对哈希值的验证匹配,实现信息篡改的快速识别。基于链上数据的记录与认证,通过智能合约实现按照唯一标识对链上相关数据进行关联,构建数据的可追溯性。
实现可信数据联合建模功能。平台的可信数据建模功能已实现多种分布式机器学习算法,包括无监督KMeans算法、多方逻辑回归、线性回归、随机森林、XGBoost、LightGBM等,部分算法如逻辑回归支持两方或多方场景。此外,为了适应监管模式,所实现的联邦学习算法均支持协调方的参与,并预留了监管友好的接口。
区块链与隐私计算结合,使原始数据在无需归集与共享的情况下,可实现多节点间的协同计算和数据隐私保护。同时,能够解决大数据模式下存在的数据过度采集、数据隐私保护,以及数据储存单点泄露等问题。区块链确保计算过程和数据可信,隐私计算实现数据可用而不可见,两者相互结合,相辅相成,实现更广泛的数据协同。
天翼电子商务有限公司(简称翼支付)是中国电信旗下唯一的互联网金融平台、是中国电信集团的成员企业,国内首家电信运营商支付公司,中国人民银行核准的第三方支付机构。作为进军金融科技从事新业态的央企子公司,是兼具“金融、电信、互联网” 特点的国家高新技术企业,公司关注5G建设、运营过程中的金融服务需求,拓展传统供应链金融、保险等相关金融配套服务。 翼支付为用户提供了最优质的金融科技服务,主营业务包含个人和企业的 “支付”、“金融 ”业务板块,具体包含了生活缴费、电商购物、交通出行、其他生活类应用、聚合支付、翼支付权益、资金归集、互联网收单、账单支付、财富管理、保险代理、证券、信贷、橙分期、商业保理、大数据风控、企业征信等数字生活、数字科技、数字金融、数字财富方面的业务。
翼支付数据要素流通技术体系从2020年至今已累计输出落地应用案例超过10余项,实现逾两千万经济效益。
其中最具有代表性的项目是苏州多方安全数据分析联合实验室项目,该项目是基于翼支付数据要素流通技术体系打造的数据要素流通新模式,满足了打击诈骗中黑灰名单共享、一人多卡、反洗钱、精准阻诈、实时追溯等多种金融反诈场景下的业务需求。
该项目是全国第一个深度融合“区块链+隐私计算”技术的大体量通用型商用系统,所部署联合计算网络已纳入包括人民银行苏州中心支行、苏州市公安局以及三十余家商业银行在内参与方,以隐私计算方式共同执行跨域计算任务,引领了行业数据隐私协作的新范式。通过打造具备自主知识产权的数据融通技术体系,构建了可信任可监管的底层数据流通环境,对于打破数据孤岛,促进数据资源开放利用,助力政府间、政企间和企业间安全高效的数据协作具有标杆意义。项目从上线至今已累计完成区域内新开个人账户命中线索数1万条以上,存量个人账户命中黑灰名单线索数5万条以上,同一客户周期内多行开卡线索数1万条以上,并向反诈中心推送涉案线索与潜在受害人近1万条。
希望以技术合作的形式,对本成果进行成果转化。在落地过程中,也希望能保证本成果的规模化应用。如有可能,希望在本成果落地后进行持续技术深化,并且将迭代后的技术进一步进行成果转化。