基于邻域相关性的面向聚类数据扰动方法被引量：1

A Neighborhood Correlation Based Data Perturbation Method for Clustering

下载PDF

导出

摘要针对面向聚类应用的隐私保护数据发布问题,引入邻域相关性概念,提出了一种基于邻域相关性的数据扰动算法NCDP,分析每个数据点邻域中与其邻域亲密的所有点以及邻域的平衡性,在不平衡情况下除去亲密集中可能的局部噪声数据点,向每个邻域亲密点进行一定长度的平移,得到扰动后的数据点.理论分析表明,扰动后的数据点不仅实现了对原始数值的保护,而且扰动前后数据点的邻域亲密点仍然维持亲密关系,从而保持了邻域的稳定性.实验采用k-means和DBSCAN聚类算法对扰动前后的数据进行聚类,并且与其他扰动算法进行了分析对比.实验结果表明,算法NCDP扰动前后的数据聚类结果有较高的相似度,可以较好地兼顾保护数据隐私与维持聚类可用性. 针对面向聚类应用的隐私保护数据发布问题,引入邻域相关性概念,提出了一种基于邻域相关性的数据扰动算法NCDP,分析每个数据点邻域中与其邻域亲密的所有点以及邻域的平衡性,在不平衡情况下除去亲密集中可能的局部噪声数据点,向每个邻域亲密点进行一定长度的平移,得到扰动后的数据点.理论分析表明,扰动后的数据点不仅实现了对原始数值的保护,而且扰动前后数据点的邻域亲密点仍然维持亲密关系,从而保持了邻域的稳定性.实验采用k-means和DBSCAN聚类算法对扰动前后的数据进行聚类,并且与其他扰动算法进行了分析对比.实验结果表明,算法NCDP扰动前后的数据聚类结果有较高的相似度,可以较好地兼顾保护数据隐私与维持聚类可用性.

作者张勇倪巍伟崇志宏胡新平

机构地区东南大学计算机科学与工程学院

出处《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期79-85,共7页 Journal of Computer Research and Development

基金国家自然科学基金项目(61003057 60973023)

关键词隐私保护数据发布聚类分析数据扰动邻域相关性邻域亲密数据平移 privacy-preserving data publishing cluster analysis data perturbation neighborhood correlation neighborhood intimate data shifting

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献3

1倪巍伟,徐立臻,崇志宏,吴英杰,刘腾腾,孙志挥.基于邻域属性熵的隐私保护数据干扰方法[J].计算机研究与发展,2009,46(3):498-504. 被引量：16
2武佳薇,李雄飞,孙涛,李巍.邻域平衡密度聚类算法[J].计算机研究与发展,2010,47(6):1044-1052. 被引量：22
3周水庚,李丰,陶宇飞,肖小奎.面向数据库应用的隐私保护研究综述[J].计算机学报,2009,32(5):847-861. 被引量：220

二级参考文献94

1倪巍伟,孙志挥,陆介平.k-LDCHD——高维空间k邻域局部密度聚类算法[J].计算机研究与发展,2005,42(5):784-791. 被引量：18
2罗永龙,黄刘生,荆巍巍,姚亦飞,陈国良.一个保护私有信息的布尔关联规则挖掘算法[J].电子学报,2005,33(5):900-903. 被引量：33
3葛伟平,汪卫,周皓峰,施伯乐.基于隐私保护的分类挖掘[J].计算机研究与发展,2006,43(1):39-45. 被引量：20
4杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
5张鹏,童云海,唐世渭,杨冬青,马秀莉.一种有效的隐私保护关联规则挖掘方法[J].软件学报,2006,17(8):1764-1774. 被引量：53
6张锋,常会友.基于分布式数据的隐私保持协同过滤推荐研究[J].计算机学报,2006,29(8):1487-1495. 被引量：17
7羌卫中,邹德清,金海.网格环境中证书和策略的隐私保护机制研究[J].计算机研究与发展,2007,44(1):11-19. 被引量：11
8Kantarcioglu M, Jin Jiasun, Clifton C. When do data mining results violate privacy [C]//Proc of the 10th ACM SIGKDD on Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2004:599-604
9Agrawal R, Srikant R. Privacy-preserving data mining [C]// Proc of the 2000 ACM SIGMOD Conf on Management of Data. New York: ACM, 2000:439-450
10Gagan Aggarwal, Tomas Feder, Krishnaram Kenthapadi, et al. Approximation algorithms for k knonymity [C] //Proc of ACM SIGMOD Int Conf on Management of Data. New York: ACM, 2007:67-78

共引文献249

1王一蕾,吴英杰,唐庆明.基于混合划分技术的隐私保护关系型数据发布算法[J].南京理工大学学报,2013,37(4):493-499. 被引量：2
2武毅,王丹,蒋宗礼.基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法[J].计算机研究与发展,2013,50(S1):248-256. 被引量：7
3万绪江,刘晓东,李洋.基于数据库管理安全的研究[J].气象与环境学报,2009,25(5):57-61. 被引量：6
4王平水,王建东.匿名化隐私保护技术研究进展[J].计算机应用研究,2010,27(6):2016-2019. 被引量：10
5兰丽辉,鞠时光,金华,刘善成.数据发布中的隐私保护研究综述[J].计算机应用研究,2010,27(8):2822-2827. 被引量：14
6申艳光,邵慧,张永强.隐私保护的分布式决策树分类算法的研究[J].计算机应用研究,2010,27(8):3070-3072. 被引量：4
7朱青,赵桐,王珊.面向查询服务的数据隐私保护算法[J].计算机学报,2010,33(8):1315-1323. 被引量：33
8刘腾腾,倪巍伟,崇志宏,张勇.多维数值敏感属性隐私保护数据发布方法[J].东南大学学报（自然科学版）,2010,40(4):699-703. 被引量：6
9陈娟,方滨兴,殷丽华,苏申.传感器网络中基于源节点有限洪泛的源位置隐私保护协议[J].计算机学报,2010,33(9):1736-1747. 被引量：53
10叶明全,胡学钢,伍长荣.垂直划分多决策表下基于条件信息熵的隐私保护属性约简[J].山东大学学报（理学版）,2010,45(9):14-19. 被引量：2

同被引文献28

1Fung B, Wang K, Chen R, et al. Privacy-Preserving Data Pub- lishing A Survey of Recent Developments [J]. ACM Computing Surveys, 2010,42 (4) : 1-53.
2Agrawal R, Srikant IL Privacy-Preserving Data Mining [J]. ACM SIGMOD Record, 2000,29 (2) : 439-450.
3Machanavajjhala A, Kifer D, Gehrke J. 1-Diversity Privacy be- yond k-Anonymity[C] // Proceedings of the 22nd International Conference on Data Engineering. Atlanta, Georgia, USA, 2006 : 24-35.
4Xiao X, Tao Y. m-Invariance: Towards Privacy Preserving Re- publication of Dynamic Datasets[C]///Proceedings of the ACM SIGMOD Conference on Management of Data. Beijing, China, 2007 : 689-700.
5Machanavajjhala A, Gehrke J. On the Efficiency of Checking Perfect Privacy[C]//Proceedings of the Symposium on Princi- ples of Database Systems. Chicago, Illinois, USA, 2006 : 163-172.
6Xiao X, Tao Y. Personalized Privacy Preservation[C] ffProceed- ings of ACM SIGMOD Conference on Management of Data. Chi- cago, 2006 : 229-240.
7Kargupta H,Datta S,Wang Q,et al. On the Privacy Preserving Properties of Random Data Perturbation Techniques [C]///Pro- eeedings of the IEEE International Conference on Data Mining. Melbourne, Florida, 2003 .. 99-106.
8Pinkas B. Cryptographic Techniques for Privacy Preserving DataMining[J]. ACM SIGKDD Explorations, 2002,4(2) : 1-14.
9Sweeney L. k-Anonymity: A Model for Protecting Privacy[J]. International Journal on Uncertainty, Fuzziness and Knowledge- Based Systems, 2002,10(5) : 557-570.
10Oliveira S R M,Zaiane O R. Protecting Sensitive Knowledge by Data Sanitization [C] ff Proceedings of the 3rd IEEE Interna- tional Conference on Data Mining. Melbourne, 2003 613-616.

引证文献1

1李晓晔,孙振龙,邓佳宾,宋广军.隐私保护技术研究综述[J].计算机科学,2013,40(11A):199-202. 被引量：4

二级引证文献4

1王姣,范科峰,王勇.面向数据发布和挖掘的隐私保护研究进展[J].网络与信息安全学报,2016,2(1):18-26. 被引量：1
2刘爽英,朱勇华.针对社交网络边权重的差分隐私保护[J].计算机工程与设计,2018,39(1):44-48. 被引量：3
3邢益精,康建光.政府强制公开个人信息的技术区分保护的策略[J].浙江理工大学学报（社会科学版）,2020,44(2):193-199. 被引量：1
4王明月,张兴,李万杰,张青云,李晓会.面向数据发布的隐私保护技术研究综述[J].小型微型计算机系统,2020,41(12):2657-2667. 被引量：11

1张冰,杨静,张健沛,谢静.面向聚类分析的邻域拓扑势熵数据扰动方法[J].哈尔滨工程大学学报,2014,35(9):1149-1155. 被引量：5
2马瑜,宋绍云.一种人工神经网络样本数据的对数螺旋线扰动方法[J].价值工程,2013,32(2):181-182.
3蔡春华,赵杰,宋丽.基于随机投影的隐私保护分布式聚类算法研究[J].牡丹江师范学院学报（自然科学版）,2014,40(3):1-3. 被引量：1
4黄茂峰,倪巍伟,王佳俊,孙福林,崇志宏.一种面向聚类的对数螺线数据扰动方法[J].计算机学报,2012,35(11):2275-2282. 被引量：7
5倪巍伟,陈耿,崇志宏,吴英杰.面向聚类的数据隐藏发布研究[J].计算机研究与发展,2012,49(5):1095-1104. 被引量：16
6李光,王亚东.一种改进的基于奇异值分解的隐私保持分类挖掘方法[J].电子学报,2012,40(4):739-744. 被引量：16
7李光,王亚东,苏小红.基于概率论的隐私保持分类挖掘[J].计算机工程,2012,38(3):12-13.
8倪巍伟,张勇,黄茂峰,崇志宏,贺玉芝.一种向量等价置换隐私保护数据干扰方法[J].软件学报,2012,23(12):3198-3208. 被引量：6
9黄伟伟,柏文阳.统计数据库中保持隐私的数据扰动方法的研究[J].计算机研究与发展,2006,43(z3):289-294. 被引量：3
10崇志宏,倪巍伟,刘腾腾,张勇.一种面向聚类的隐私保护数据发布方法[J].计算机研究与发展,2010,47(12):2083-2089. 被引量：13

计算机研究与发展

2011年第S3期

浏览历史

内容加载中请稍等...

基于邻域相关性的面向聚类数据扰动方法被引量：1

参考文献3

二级参考文献94

共引文献249

同被引文献28

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于邻域相关性的面向聚类数据扰动方法 被引量：1

参考文献3

二级参考文献94

共引文献249

同被引文献28

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于邻域相关性的面向聚类数据扰动方法被引量：1