基于聚类的数据敏感属性匿名保护算法被引量：4

Clustering-based algorithm for data sensitive attributes anonymous protection

下载PDF

导出

摘要为了防止数据敏感属性的泄露,需要对数据敏感属性进行匿名保护。针对l-多样性模型当前已提出的算法大多是建立在概念层次结构的基础上,该方法会导致不必要的信息损失。为此,将基于属性泛化层次距离KACA算法中的距离度量方法与聚类结合,提出了一种基于聚类的数据敏感属性匿名保护算法。该算法按照l-多样性模型的要求对数据集进行聚类。实验结果表明,该算法既能对数据中的敏感属性值进行匿名保护,又能降低信息的损失程度。 In order to prevent the disclosure of data sensitive attributes,it requires preserving the anonymity of data sensitive attributes.The current algorithm that has proposed to meet l-diversity is mostly based on the hierarchy,which can lead to unnecessary information loss.For this reason,this paper proposed a clustering-based algorithm for data sensitive attributes anonymous protection,it adopted an improved distance measure method which was from achieving k-anonymity by clustering in attribute hierarchical structures and combined clustering together,the algorithm in accordance with the requirements of l-diversity model clustering of data sets.Experimental results show that the algorithm can not only protect anonymity of sensitive attri-butes in data set,but also reduce the extent of information losses.

作者李珊珊朱玉全陈耿

机构地区江苏大学计算机科学与通信工程学院南京审计学院信息科学学院

出处《计算机应用研究》 CSCD 北大核心 2012年第2期469-471,共3页 Application Research of Computers

基金国家自然科学基金资助项目(70971067) 江苏省自然科学基金基础研究计划资助项目(BK2010331)

关键词敏感属性 l-多样性聚类信息损失 sensitive attribute l-diversity clustering information loss

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1SWEENEY L. K-anonymity: a model for protecting privacy[ J]. In- ternational Journal of Uncertainty, Fuzziness and Knowledge- based Systems,2002,10 (5) :557- 570.
2MACHANAVAJJHALA A, GEHRKE J, KIFER D. L-diversity: pri- vacy beyond k-anonymity[ J]. ACM Trans on Knowledge Disco- very from Data,2007,1 (1) :24-35.
3LEFEVRE K, DEWITrD J, RAMAKRISHNAN R. Incognito: effi- cient full-domain k-anonymity [ C ]//Proc of ACM SIGMOD Interna- tional Conference on Management of Data. New York: ACM Press, 2005,49-60.
4AGGARWAL G, FEDER T, KENTHAPADI T, et al. Achieving ano- nymity via clustering[ C ]//Proc of Symposium on Principles of Data- base Systems. New York: ACM Press, 2006 : 153-162.
5BYUN J W, KAMRA A, BERTINO E, et al. Efficient k-anonymiza- tion using clustering techniques [ C ]//Proc of the 12th International Conference on Database Systems for Advanced Applications. Berlin: Springer-Verlag, 2007 : 188- 200.
6LI Jiu-yong, WONG R C W, FU A W C, et al. Achieving k-anony- mity by clustering in attribute hierarchical structures[ C~//Proc of the 8th International Conference on Data Warehousing and Knowledge Discovery. 2006:405- 416.
7杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
8LIN Jun-lin, WEI Meng-cheng. Genetic algorithm-based clustering approach for k-anonymization [ J ]. Expert Systems with Applica- tions,2009,36(6) :9784-9792.
9LU Li-jian, YE Xiao-jun. An improved weighted-feature clustering algorithm for k-anonymity [ C ]//Proc of the 5th International Confe- rence on Information Assurance and Security. Washington DC: IEEE Computer Society, 2009:415-419.
10于娟韩建民郭腾芳等.基于聚类的高效☆ 匿名化算法.计算机研究与发展,2009,46:105-111.

二级参考文献10

1Sweeney L.K-Anonymity:A model for protecting privacy.Int'l Journal on Uncertainty,Fuzziness and Knowledge Based Systems,2002,10(5):557-570.
2Liu XY,Yang XC,Yu G.A representative classes based privacy preserving data publishing approach with high precision.Computer Science,2005,32(9A):368-373 (in English with Chinese abstract).
3Meyerson A,Williams R.On the complexity of optimal k-anonymity.In:Deutsch A,ed.Proc.of the 23rd ACM SIGACT-SIGMOD-SIGART Symp.on Principles of Database Systems (PODS 2004).New York:ACM,2004.223-228.
4Aggarwal G,Feder T,Kenthapadi K,Motwani R,Panigrahy R,Thomas D,Zhu A.Anonymizingtables.In:Eiter T,Libkin L,eds.Proc.of the 10th Int'l Conf.on Database Theory (ICDT 2005) LNCS 3363,Springer-Verlag,2005.246-258.
5Iyengar V.Transforming data to satisfy privacy constraints.In:Zaiane O,ed.Proc.of the 8th ACM SIGKDD Int'l Conf.on Knowledge Discovery and Data Mining (KDD 2002).New York:ACM,2002.279-288.
6Yao C,Wang XS,Jajodia S.Checking fork-anonymity violation by views.In:Bohm K,Jensen CS,Hass LM,Kersten ML,Larson P,Ooi BC,eds.Proc.of the 31st Int'l Conf.on Very Large Data Bases (VLDB 2005).Trondheim:ACM,2005.910-921.
7Sweeney L.Guaranteeing anonymity when sharing medical data,the Datafly system.In:Masys DR,ed.Proc.of the 1997American Medical Informatics Association Annual Fall Symp (AMIA'97).1997.51-55.http://www.amia.org/pubs/symposia/D004462.pdf
8LeFevre K,DeWitt D,Ramakrishnan R.Incognito:Efficient full-domain k-anonymity.In:Ozcan F,ed.Proc.of the ACM SIGMOD Int'l Conf.on Management of Data.New York:ACM,2005.49-60.
9Fung B,Wang K,Yu P.Top-Down specialization for information and privacy preservation.In:Toyama M,Sasaki S,eds.Proc.of the 21st Int'l Conf.on Data Engineering (ICDE 2005).Tokyo:IEEE Computer Society,2005.205-216.
10Sweeney L.Achieving k-anonymity privacy protection using generalization and suppression.Int'l Journal on Uncertainty,Fuzziness and Knowledge-Based Systems,2002,10(5):571-588.

共引文献59

1岑婷婷,韩建民,王基一,李细雨.隐私保护中K-匿名模型的综述[J].计算机工程与应用,2008,44(4):130-134. 被引量：18
2杨晓春,王雅哲,王斌,于戈.数据发布中面向多敏感属性的隐私保护方法[J].计算机学报,2008,31(4):574-587. 被引量：59
3黄立明,宋金玲,刘国华,张奇.视图的k-匿名化方法[J].计算机工程与应用,2008,44(17):115-118.
4宋金玲,黄立明,周国红,李玉香.视图发布的安全问题(综述)[J].河北科技师范学院学报,2008,22(2):76-80.
5宋金玲,黄立明,刘国华.k-匿名方法中准标识符的求解算法[J].小型微型计算机系统,2008,29(9):1688-1693. 被引量：7
6韩建民,岑婷婷,虞慧群.数据表k-匿名化的微聚集算法研究[J].电子学报,2008,36(10):2021-2029. 被引量：40
7宋金玲,刘国华,黄立明,朱彩云.k-匿名方法中相关视图集和准标识符的求解算法[J].计算机研究与发展,2009,46(1):77-88. 被引量：7
8李太勇,唐常杰,吴江,周敏.基于两次聚类的k-匿名隐私保护[J].吉林大学学报（信息科学版）,2009,27(2):173-178. 被引量：1
9林欣,李善平,杨朝晖.LBS中连续查询攻击算法及匿名性度量[J].软件学报,2009,20(4):1058-1068. 被引量：32
10周水庚,李丰,陶宇飞,肖小奎.面向数据库应用的隐私保护研究综述[J].计算机学报,2009,32(5):847-861. 被引量：221

同被引文献36

1武毅,王丹,蒋宗礼.基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法[J].计算机研究与发展,2013,50(S1):248-256. 被引量：7
2于戈;李芳芳.物联网中的数据管理[J]{H}中国计算机学会通讯,2010(04):30-34.
3丁治明.物联网对软件技术的挑战及其对策[J]{H}中国计算机学会通讯,2011(01):49-50.
4Sweeney L. K-anonymity:A model for protecting privacy[J].International Journal on certainty Fuzziness and Knowledgn-based Systems,2002,(05):557-570.
5Machanavajjhala A,Gehrke J,Kifer D. L-diversity:Privacy beyond k-anonymity[A].Atlanta,GA,USA:IEEE Press,2006.24-36.
6Machanavajjhala A,Kifer D,Gehrke J. l-diversity:Privacy beyond k-anonymity[J].ACM Transactions on Knowledge Discovery from Data,2007,(01):1-52.
7Wong R,Li J,Fu A. (α,k)-Anonymous data publishing[J].{H}JOURNAL OF INTELLIGENT INFORMATION SYSTEMS,2009,(02):209-234.
8Aggarwal G,Feder T,Kenthapadi K. Achieving anonymity via clustering[A].{H}New York:ACM Press,2006.153-162.
9朱玉全,胡天寒,陈耿,常鹏.序列模式挖掘中的隐私保护方法研究[J].计算机应用研究,2009,26(7):2489-2491. 被引量：4
10张颖君,冯登国.基于尺度的时空RBAC模型[J].计算机研究与发展,2010,47(7):1252-1260. 被引量：20

引证文献4

1韦火旺,钟诚.基于并行聚类的物联网k-匿名算法[J].信息技术,2013,37(12):6-10. 被引量：2
2吕欣,韩晓露.大数据安全和隐私保护技术架构研究[J].信息安全研究,2016,2(3):244-250. 被引量：49
3陈国威.大数据时代的个人信息安全研究[J].网络安全技术与应用,2018(7):56-58. 被引量：8
4王芳,余敦辉,张万山.基于局部划分的匿名算法研究[J].计算机应用研究,2019,36(10):3048-3053. 被引量：3

二级引证文献62

1刘湘平.大数据时代的个人信息保护研究[J].新商务周刊,2019,0(18):296-298.
2李怡,杨帆,安克万.我国个人信息保护制度体系构建探析[J].网络安全技术与应用,2018(12):7-8. 被引量：2
3吕欣,韩晓露,李阳.智慧城市网络安全保障评价体系研究[J].信息安全研究,2016,2(5):447-453. 被引量：8
4吕欣,韩晓露,毕钰,李阳.大数据安全保障框架与评价体系研究[J].信息安全研究,2016,2(10):913-919. 被引量：10
5刘鸿霞,李建清,张锐卿.立体动态的大数据安全防护体系架构研究[J].信息网络安全,2016(9):18-25. 被引量：26
6高翔.大数据安全与隐私保护的必要性及措施[J].电子技术与软件工程,2016(20):208-208. 被引量：3
7郭泽炎.大数据环境下的数据安全研究[J].电子世界,2017,0(2):37-37. 被引量：1
8郭敏,张少波,李向东,王国军.物联网环境下位置隐私保护技术研究[J].小型微型计算机系统,2017,38(9):1961-1965. 被引量：5
9田燕,张新刚,王高华,王保平.大数据环境下信息安全风险分析与应对策略[J].创新科技,2017,17(6):31-33. 被引量：11
10孟庆华.基于消费者行为特征大数据平台信息安全与隐私保护模型研究[J].上海商学院学报,2017,18(3):30-36. 被引量：5

1王庆飞,方翔,朱根.数据发布中的K-匿名隐私保护机制研究[J].福建电脑,2015,31(4):3-4 17. 被引量：1
2王玉健.基于增量更新视域的数据库隐私保护方法探讨[J].计算机光盘软件与应用,2014,17(19):212-212.
3王远清.基于GIS火电厂管理系统设计[J].东北电力技术,2010,31(9):21-23. 被引量：2
4姚玉钦,李金广.一种基于网格的层次聚类算法[J].河南师范大学学报（自然科学版）,2009,37(4):42-44. 被引量：1
5KAC-3100／5000：3101500万像素图像传感器[J].世界电子元器件,2005(10):97-97.
6陈丹叶,窦延平.属性泛化的数据挖掘在销售业务中的应用[J].微型电脑应用,2009,25(1):54-55.
7张冰,杨静,张健沛,谢静.面向敏感性攻击的多敏感属性数据逆聚类隐私保护方法[J].电子学报,2014,42(5):896-903. 被引量：5
8徐勇,丁忠明,王浩,黄灿.基于熵理论的匿名发布表质量度量方法研究[J].计算机应用研究,2011,28(10):3834-3836.
9张文宇,张铭华.基于面向属性泛化及信息增益的数据挖掘方法研究[J].计算机应用,2006,26(4):861-863. 被引量：2
10陈明.浅谈数据恢复技术[J].中国科技博览,2009(33):341-341. 被引量：1

计算机应用研究

2012年第2期

浏览历史

内容加载中请稍等...

基于聚类的数据敏感属性匿名保护算法被引量：4

参考文献10

二级参考文献10

共引文献59

同被引文献36

引证文献4

二级引证文献62

相关作者

相关机构

相关主题

浏览历史

基于聚类的数据敏感属性匿名保护算法 被引量：4

参考文献10

二级参考文献10

共引文献59

同被引文献36

引证文献4

二级引证文献62

相关作者

相关机构

相关主题

浏览历史

基于聚类的数据敏感属性匿名保护算法被引量：4