

信息安全工程师知识点:随机扰动
随机扰动采用随机化过程来修改敏感数据,从而实现对数据隐私的保护。一个简单的随机扰动模望如表5-4(a)所示。

对外界而言,只可见扰动后的数据,从而实现了对真实数据值的隐藏。但扰动后数据仍然保留着原始数据分布X的信息,通过对扰动后的数据进行重构(表5-4 (b)所示),可以恢复原始数据分布X 的信息。但不能重构原始数据的精确值x1,x2,...,xn。
随机扰动技术可以在不暴露原始数据的情况下进行多种数据挖掘操作。由于通过扰动数据重构后的数据分布几乎等同于原始数据的分布,因此利用重构数据的分布进行决策树分类器训练后,得到的决策树能很好地对数据进行分类。在关联规则挖掘中,通过往原始数据注入大量伪项(false item)来对频繁项集进行隐藏,再通过在随机扰动后的数据上估计项集支持度,从而发现关联规则。
| 各省软考办 | ||||||||||