(k,l)-多样性数据发布研究被引量：4

Achieving(k,l)-Diversity in Privacy Preserving Data Publishing

下载PDF

导出

摘要发布未经处理的数据会导致身份泄露和敏感属性泄露,通过概化准标识符可以达到隐私保护的目的,但信息损失过大。针对该问题提出一种基于聚类的(k,l)-多样性数据发布模型并设计算法予以实现。通过使用概率联合分布度量数据对象的离散属性和连续属性相似性,提高了数据的效用。详细论述了簇的合并、调整和概化策略,结合参数k和l提出隐私保护度概念,指出了基于聚类的最优化(k,l)-多样性算法是NP-难问题,并分析了算法的复杂度。理论分析和实验结果表明,该方法可以有效减少执行时间和信息损失,提高查询精度。 In order to avoid disclosure of individual identity and sensitive attribute,reduce the information loss when da- ta release, a clustering-based algorithm to achieve（k, l）-diversity（CBAD）in data publishing was presented. The discrete attributes and continuous attributes mixed in the data set were fully taken into account while clustering. The probability distribution was used as metrics to measure similarity between the data objects. We solved the confusion of the informa- tion loss and the distance between data objects, pointed out that the clustering-based optimization（k,/）-diversity algo- rithrn is NP-hard problem, proposed the concept of privacy protection degree with parameter k and l, and analysed the complexity of the algorithm. Theoretical analysis and experimental results show that the method can effectively reduce the execution time and information loss, improve query precision.

作者杨高明李敬兆杨静朱广丽

机构地区安徽理工大学计算机科学与工程学院哈尔滨工程大学计算机科学与技术学院

出处《计算机科学》 CSCD 北大核心 2013年第8期140-145,共6页 Computer Science

基金国家自然科学基金(61073043 61170060) 安徽高等学校省级自然科学基金(KJ2011Z098)资助

关键词隐私保护数据发布 l-多样性数据效用聚类相似性度量 Privacy preserving Data publishing l-Diversity Data utility Clustering Similarity measures

分类号 TP309.2 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献16

1杨高明,杨静,张健沛.隐私保护的数据发布研究[J].计算机科学,2011,38(9):11-17. 被引量：16
2Machanavajjhala A,Gehrke J, Kifer D, et al./-Diversity: Privacy beyond k-anonymity[C]//22nd International Conference on Da- ta Engineering: Institute of Electrical and Electronics Engineers Computer Society. Atlanta,G A, United states, 2006:24.
3Wong R,Li J ,Fu A,et al. (a,k)-anonyrnous data publishing[J]. Journal of Intelligent In'ormation Systems, 2009,33, (2): 209- 23,.
4Ninghui L, Tiancheng L, Venkatasubramanian K t-Closeness: Privacy beyond k-anonymity and l-diversity[C]//Proceedings of the 23rd International Conference on Data Engineering. Inst. of Elec. and Elec. Eng. Computer Society, Istanbul, Turkey, 2007: 106-115.
5Lefevre K, Dewitt D .l, Ramakrishnan tL Incognito: Efficient full-domain k-anonymity [C] // ACM SIGMOD International Conference on Management of Data. United states. Association for Computing Machinery, Baltimore, Maryland, 2005 : 49-60.
6Kabir M E, Wang H, Bertino E. Efficient systematic clustering method for k-anonymization [J]. Acta Informatica, 2011, 48, (1):51-66.
7Aggarwal G,Panigrahy R, Tom, et al. Achieving anonymity via clustering [J]. ACM Trans. Algorithms, 2010,6 (3) : 1-19.
8王智慧,许俭,汪卫,施伯乐.一种基于聚类的数据匿名方法[J].软件学报,2010,21(4):680-693. 被引量：49
9Kenig B,Tassa T. A practical approximation algorithm for opti- mal k-anonymity[J]. Data Mining and Knowledge Discovery, 2012,25(1) : 134-168.
10aNi W, Chong Z. Clustering-oriented privacy-preserving data pub-lishing[J]. Knowledge-Based Systems, 2012,35 : 264-270.

二级参考文献40

1杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
2Samarati P. Protecting Respondents Identities in Microdata Release [J]. IEEE Transactions on Knowledge and Data Engineering, 2001,13(6) : 1010-1027.
3Sweeney L. Achieving k-anonymity privacy protection using generalization and suppression[J]. International Journal of Uncertainty Fuzziness and Knowledge-Based Systems, 2002, 10 (5)1571-588.
4Wang K, Fung B C M. Anonymizing sequential releases[C]// Proceedings of KDD 2006. Philadelphia, PA, USA:ACM, 2006:414-423.
5Fung B C M, Wang K, Chen R, et al. Privacy-preserving data publishing:A survey of recent developments [J]. ACM Comput. Surv. ,2010,42(4) :1-53.
6Nergiz M E, Clifton C, Nergiz A E. Multirelational k-anonymity [C] // Proceedings of ICDE ' 07. Istanbul, Turkey, 2007: 1417- 1421.
7Machanavajihala A, Kifer D, Gehrke J, et al.l-diversity.. Privacy beyond k-anonymity[J-. ACM Transactions on Knowledge Discovery from Data, 2007,1 (1).
8Wong R,Li J,Fu A,et al. (a,k)-anonymity..an enhanced k-anonyrnity model for privacy preserving data publishing [C]// Proceedings of KDD 2006. ACM, 2006:754-759.
9Zhang Q, Koudas N, Srivastava D, et al. Aggregate query answering on anonymized tablesFC-ffProeeedings of ICDE'07. Istanbul, Turkey, 2007 : 116-125.
10Li J, Tao Y, Xiao X. Preservation of proximity privacy in publishing numerical sensitive data [C]//Proc. ACM SIGMOD Int. Conf. Manage. Data. Vancouver, Canada: ACM, 2008 : 473-486.

共引文献62

1王平水.基于聚类的匿名化隐私保护技术研究[J].现代图书情报技术,2010(11):53-58. 被引量：2
2杨高明,杨静,张健沛.聚类的(α,k)-匿名数据发布[J].电子学报,2011,39(8):1941-1946. 被引量：19
3杨高明,杨静,张健沛.隐私保护的数据发布研究[J].计算机科学,2011,38(9):11-17. 被引量：16
4王平水,马钦娟.隐私保护k-匿名算法研究[J].计算机工程与应用,2011,47(28):117-119. 被引量：12
5焉凯,何贤芒.基于局部聚类的数据匿名化算法[J].计算机应用研究,2012,29(1):148-151. 被引量：5
6杨高明,杨静,张健沛.半监督聚类的匿名数据发布[J].哈尔滨工程大学学报,2011,32(11):1489-1494. 被引量：6
7丁媛媛.K-匿名技术在无线传感器网络隐私保护中的应用[J].内蒙古民族大学学报（自然科学版）,2011,26(6):650-652. 被引量：1
8张付志,贾长伟,徐玉辰.基于聚类的l-多样性匿名方法[J].燕山大学学报,2012,36(1):32-38.
9王波,杨静.数据发布中的个性化隐私匿名技术研究[J].计算机科学,2012,39(4):168-171. 被引量：12
10王波,杨静.一种基于逆聚类的个性化隐私匿名方法[J].电子学报,2012,40(5):883-890. 被引量：25

同被引文献31

1孟小峰,王雷霞,刘俊旭.人工智能时代的数据隐私、垄断与公平[J].大数据,2020,6(1):35-46. 被引量：16
2晏华,刘贵松.采用熵的多维K-匿名划分方法[J].电子科技大学学报,2007,36(6):1228-1231. 被引量：4
3夏赞珠,韩建民,于娟,郭腾芳.用于实现(k,e)-匿名模型的MDAV算法[J].计算机工程,2010,36(15):159-161. 被引量：6
4杨高明,杨静,张健沛.聚类的(α,k)-匿名数据发布[J].电子学报,2011,39(8):1941-1946. 被引量：19
5王平水,王建东.一种基于聚类的个性化(l,c)-匿名算法[J].计算机工程与应用,2012,48(23):16-20. 被引量：4
6吕品,钟珞,于文兵,何成万.MA-Datafly:一种支持多属性泛化的k-匿名方法[J].计算机工程与应用,2013,49(4):138-140. 被引量：6
7张健沛,谢静,杨静,张冰.基于敏感属性值语义桶分组的t-closeness隐私模型[J].计算机研究与发展,2014,51(1):126-137. 被引量：14
8冯登国,张敏,李昊.大数据安全与隐私保护[J].计算机学报,2014,37(1):246-258. 被引量：727
9韦茜,李星毅.基于K-匿名的快递信息隐私保护应用[J].计算机应用研究,2014,31(2):555-557. 被引量：7
10钟浙云,韩建民,王海元,陈新驰.抵制敏感属性近似攻击的(k,l,e)-匿名模型[J].小型微型计算机系统,2014,35(7):1491-1495. 被引量：4

引证文献4

1宋明秋,王琳,姜宝彦,邓贵仕.多属性泛化的K-匿名算法[J].电子科技大学学报,2017,46(6):896-901. 被引量：11
2高帅,徐雅斌,武装.一种抗相似性攻击的匿名保护方法[J].北京信息科技大学学报（自然科学版）,2020,35(4):63-68.
3吴荣士,叶欣欣,许林涛,裴成飞.基于k-means++的多敏感属性t-closeness隐私保护[J].洛阳理工学院学报（自然科学版）,2020,30(3):69-74.
4吴珺,郑欣丽,朱嘉辉,李天意.基于PCA-GRA-BK算法的医疗大数据分析[J].华中师范大学学报（自然科学版）,2023,57(3):364-372. 被引量：2

二级引证文献13

1付奇,易超.基于Datafly算法的多属性泛化技术研究[J].信息与电脑,2018,30(11):55-57.
2杨武俊.模块化神经网络容差模拟电路故障检测[J].计算机测量与控制,2019,27(1):32-35. 被引量：1
3刘光磊,肖辉.基于敏感属性聚类的电子病历隐私保护算法[J].中国数字医学,2019,14(11):88-90. 被引量：3
4朱锐.互连通信中多主机网络转发信息匿名方法仿真[J].计算机仿真,2019,36(12):155-158. 被引量：1
5张梅舒,徐雅斌.多维数值型敏感属性数据的个性化隐私保护方法[J].计算机应用,2020,40(2):491-496. 被引量：18
6彭丽寻,刘丰恺.基于个性化k匿名隐私保护的资源推荐算法[J].电脑与电信,2020(6):66-73.
7刘振鹏,孙静薇,王烁,王文胜,尹文召,张彬.PDMP:εk个性化数据脱敏保护方法[J].计算机应用研究,2020,37(10):3068-3070. 被引量：2
8陈先来,罗霄,刘莉,李忠民,安莹.基于识别率的多叉树森林k-匿名算法[J].数据分析与知识发现,2020,4(12):14-25.
9苏林萍,董子娴,李为,吴克河,崔文超.支持多属性泛化的个性化(α,l,k)匿名模型[J].计算机技术与发展,2021,31(6):88-93. 被引量：1
10康海燕,邓婕.面向医疗数据可信共享的映射泛化(k,l)-匿名算法[J].北京信息科技大学学报（自然科学版）,2021,36(5):1-8. 被引量：1

1王茜,屈盛知,石香灵.基于敏感属性值泄露个数期望的匿名模型[J].计算机应用研究,2009,26(3):1109-1111.
2党杨阳.XML信息检索技术综述[J].甘肃科技,2011,27(19):40-42.
3王家波,赵泽茂,李林.位置服务中一种基于假轨迹的轨迹隐私保护方法[J].信息网络安全,2014(3):62-67. 被引量：7
4叶凝,应忍冬,朱新忠,李超,刘佩林.高可靠性片上系统总线结构的参数优化[J].计算机与现代化,2013(9):190-194.
5万钧,吴筱媛,李微刚,张世永.一个基于浏览器与组件技术的Web信息发布模型[J].计算机工程与应用,2002,38(8):159-162. 被引量：4
6陈旖,张美平,许力.WSN应用层协议MQTT-SN与CoAP的剖析与改进[J].计算机系统应用,2015,24(2):229-234. 被引量：10
7熊妍,罗泽,苏锦河,阎保平.生物多样性数据的Web可视化[J].科研信息化技术与应用,2015,6(3):35-42. 被引量：3
8王刚,刘路放,冯博琴,薛亮.基于Web的受限调查通用平台研究[J].小型微型计算机系统,2002,23(7):824-826.
9赵雪,陈龙飞.基于MapReduce的ROCK聚类算法[J].河北科技师范学院学报,2014,28(1):26-32. 被引量：1
10兰丽辉,鞠时光.一种基于随机投影的加权社会网络隐私保护方法[J].计算机科学,2016,43(3):151-157. 被引量：4

计算机科学

2013年第8期

浏览历史

内容加载中请稍等...

(k,l)-多样性数据发布研究被引量：4

参考文献16

二级参考文献40

共引文献62

同被引文献31

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

(k,l)-多样性数据发布研究 被引量：4

参考文献16

二级参考文献40

共引文献62

同被引文献31

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

(k,l)-多样性数据发布研究被引量：4