-
题名基于属性分割的高维二值数据差分隐私发布
被引量:5
- 1
-
-
作者
洪金鑫
吴英杰
蔡剑平
孙岚
-
机构
福州大学数学与计算机科学学院
厦门华厦学院信息与智能机电工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2022年第1期182-196,共15页
-
基金
福建省自然科学基金项目(2017J01754,2018J01797)。
-
文摘
通常随着数据集属性维度的增加,高维数据的差分隐私发布方法所需的时间成本和产生的噪声干扰也会随之增大,尤其是对于高维二值数据很容易被过大的噪声所覆盖.因此,针对高维二值数据的隐私发布问题,提出了一种高效且低噪的发布方法PrivSCBN(differentially private spectral clustering Bayesian network).首先,该方法基于Jaccard距离,使用满足差分隐私的谱聚类算法来划分属性集,然后根据划分的结果来进一步分割原始数据集,从而实现数据的降维.其次,该方法基于动态规划思想并结合指数机制,使用满足差分隐私的贝叶斯网络快速构建算法来为每个分割后的子集构建贝叶斯网络.最后,该方法利用条件概率在二值数据上的取值特点,对从贝叶斯网络中提取的条件分布进行加噪,并通过控制贝叶斯网络的最大入度数来减少其产生的噪声大小.通过在3个真实高维二值数据集上的实验,验证了PrivSCBN方法的高效性与可用性.
-
关键词
差分隐私
高维二值数据发布
贝叶斯网络
属性划分
动态规划
条件分布
-
Keywords
differential privacy
high-dimensional binary data publication
Bayesian network
attribute division
dynamic programming
conditional distribution
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-