如何提高云计算数据加密保护隐私模式

       随着各种智能设备的普及,大量的数据不断生成和收集,机器学习技术允许从这些数据中分析和提取隐藏和有价值的信息。一般来说,训练数据集越大,机器学习训练获得的模型就越准确,但也需要大量的计算资源。云计算以其存储容量大、计算能力强、扩展性强、性价比高等特点,逐渐成为机器学习训练的理想平台。然而,如果将存储和计算任务外包到云服务器,隐私问题将得不到保证。

outputo-20211019-091516-371-lrmu.png

在机器学习模型的训练和预测阶段,云服务器可以获得训练数据和用户查询和分类结果,这将涉及到用户的隐私问题。同时,云服务器通过机器学习获得的训练模型应该是独特的,不应该公开,也不应该泄露任何相关参数。针对这些问题,在机器学习训练和预测的过程中,采取有效的隐私保护措施是非常必要的。在目前的机器学习技术中,决策树是应用最广泛的模型之一,已成功应用于医疗诊断、人脸识别等各个领域。在医疗诊断中,医务人员可以将患者的医疗记录上传到云服务器,以获得潜在疾病的症状评估和风险介绍。然而,患者不希望他们的个人隐私和诊断结果被泄露,医院在云服务器上训练的机器学习模型通常应该是医院私有的。在过去的几年里,许多方案被提出来解决这些隐私保护问题。这些方案主要分为非加密技术和加密技术。非加密技术与数据的混淆和差异化将更容易实现隐私和机器学习模型的实用性。此外,还提供了更高的隐私保护。在决策树评估中,需要计算加密的决策树节点,同态加密技术可以直接对加密数据进行加法或乘法操作,解密结果与用同一方法处理未加密原始数据的输出结果一致。因此,本文将使用同态加密来解决隐私问题。早期对这一问题的研究主要集中在隐私保护决策树的培训上。近年来,一些学者提出在分类阶段保护隐私,但目前的方案计算成本较大,模型隐私仍没有得到很好的保护。

PPDE系统将决策树视为多项式,通过计算多项式得到分类结果,但该方案采用完全同态加密,计算成本昂贵。此外,在他们的工作中,预测模型属于公共信息,而在实际情况下,模型所有者希望模型保密。随后,学者们提出了一个更轻的密码系统,即加性同态加密,而不是全同态加密,这降低了计算成本。Tueno提出了一种将决策树表示为数组的方案,实现了无意中的数组索引。该方案采用无序代码电路,无意中传输和随机访问存储器,只需执行树的深度D比较,计算成本降低,但该方案不能保证模型参数不被泄露。Cock等。通过引入可信的第三方进行初始化,以提高评估效率。该方案基于密钥共享技术,深度和宽度较小的树处理效率较高,但深度和宽度较低的树处理速度较低。此外,这些方案不支持多用户的密钥,也不能很好地保护决策树模型的隐私。Alock等。然而,计算成本很高。Xue提出了一个基于同意的隐私保护决策树评估方案,保护了决策树模型的隐私,并引入了服务代理来降低用户的计算成本,但该方案不支持多用户多密钥。引入可信的第三方密钥生成中心支持多密钥,降低通信成本,支持模型的隐私保护,但不支持服务代理,用户计算成本较大。

分享: