一种考虑属性权重的隐私保护数据发布方法被引量：17

A QI Weight-Aware Approach to Privacy Preserving Publishing Data Set

下载PDF

导出

摘要 k-匿名模型是数据发布领域用于对原始待发布数据集进行匿名处理以阻止链接攻击的有效方法之一,但已有的k-匿名及其改进模型没有考虑不同应用领域对匿名发布表数据质量需求不同的问题.在特定应用领域不同准码属性对基于匿名发布表的数据分析任务效用的贡献程度是不同的,若没有根据发布表用途的差异区别处理各准码属性的泛化过程,将会导致泛化后匿名发布表数据效用较差、无法满足具体数据分析任务的需要.在分析不同应用领域数据分析任务特点的基础上,首先通过修正基本ODP目录系统建立适用于特定问题领域的概念泛化结构;然后在泛化过程中为不同准码属性的泛化路径设置权重以反映具体数据分析任务对各准码属性的不同要求;最后设计一种考虑属性权重的数据匿名发布算法WAK(QI weight-aware k-anonymity),这是一种灵活地保持匿名发布表数据效用的隐私保护问题解决方案.示例分析和实验结果表明,利用该方案求解的泛化匿名发布表在达到指定隐私保护目标的同时,能够保持较高的数据效用,满足具体应用领域特定数据分析任务对数据质量的要求. In recent years, publishing data about individuals without revealing their identity information has become an active issue, and k-anonymity based models are the effective techniques that can prevent linking attacks. Most of the previous works, however, focus on the efficiency and the scope of application of the models. Specific requirements of quality of published microdata for the analyzing task in various scenarios and the difference of contributions of each QI attribute to the result have not been addressed. If the contribution of different generalizing paths and orders of QI attributes has not been considered, the published microdata may have bad utility in the application. Paying more attention to them, which makes the published table have different utility, is valuable. By analyzing the differences among several application areas, a scheme which provides an effective and secure tradeoff of privacy and utility, is proposed. Firstly the basic ODP is revised to indicate the characters of special domain. Secondly, the weight on quasi-attribute is introduced to reflect the effect for the data analyzing task. And then QI weight-aware k-anonymity （WAK）, which is an algorithm based on the weight of attribute, is introduced. Theoretical analysis and experimental results testify that the scheme is effective and can preserve privacy of the sensitive data well, meanwhile maintaining better data utility.

作者徐勇秦小麟杨一涛杨种学黄灿

机构地区南京航空航天大学信息科学与技术学院安徽财经大学计算机科学与技术系

出处《计算机研究与发展》 EI CSCD 北大核心 2012年第5期913-924,共12页 Journal of Computer Research and Development

基金国家自然科学基金项目(60673127) 国家"八六三"高技术研究发展计划基金项目(2007AA01Z404) 高等学校博士学科点专项科研基金项目(20103218110017) 江苏省科技支撑计划基金项目(BE2008135) 安徽高校省级自然科学研究重大项目(KJ2010ZD01)

关键词数据发布隐私保护权重 K-匿名泛化 data publishing privacy preserving weight k-anonymity generalization

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献16

1Sieg A,Mobasher B,Burke R. Web search personalization with ontological user profiles[A].New York:ACM,2007.525-534.
2Shang Ning,Paci F,Nabeel M. A privacy-preserving approach to policy-based content dissemination[A].Piscataway,NJ:IEEE,2010.944-955.
3Inan A,Kantarcioglu M,Bertino E. Using anonymized data for classification[A].Piscataway,NJ:IEEE,2009.429-440.
4Kohavi R,Becker B. UCI machine learning reposity[OL].http://archive.ics.uci.edu/ml/datasets/Adult,2010.
5Sweeney L. Achieving k-anonymity privacy protection using generalization and suppression[J].International Journal on Uncertainty Fuzziness and Knowledge-Based Systems,2002,(05):571-588.
6Li Ninghui,Li Tiancheng,Venkatasubramanian S. T-closeness:Privacy beyond k-anonymity and l-diversity[A].Los Alamitos,CA:IEEE Computer Society,2007.106-115.
7Skrenta R. Open directory project[OL].http://www.dmoz.org/,2010.
8Sweeney L. K-anonymity:A model for protecting privacy[J].Journal on Uncertainty Fuzziness and Knowledge-based Systems,2002,(05):557-570.
9Xu Jian,Wang Wei,Pei Jian. Utility-based anonymization using local recoding[A].New York:ACM,2006.785-790.
10刘玉葆,黄志兰,傅慰慈,印鉴.基于有损分解的数据隐私保护方法[J].计算机研究与发展,2009,46(7):1217-1225. 被引量：21

二级参考文献40

1倪巍伟,孙志挥,陆介平.k-LDCHD——高维空间k邻域局部密度聚类算法[J].计算机研究与发展,2005,42(5):784-791. 被引量：18
2葛伟平,汪卫,周皓峰,施伯乐.基于隐私保护的分类挖掘[J].计算机研究与发展,2006,43(1):39-45. 被引量：20
3杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
4张鹏,童云海,唐世渭,杨冬青,马秀莉.一种有效的隐私保护关联规则挖掘方法[J].软件学报,2006,17(8):1764-1774. 被引量：53
5Kantarcioglu M, Jin Jiasun, Clifton C. When do data mining results violate privacy [C]//Proc of the 10th ACM SIGKDD on Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2004:599-604
6Agrawal R, Srikant R. Privacy-preserving data mining [C]// Proc of the 2000 ACM SIGMOD Conf on Management of Data. New York: ACM, 2000:439-450
7Gagan Aggarwal, Tomas Feder, Krishnaram Kenthapadi, et al. Approximation algorithms for k knonymity [C] //Proc of ACM SIGMOD Int Conf on Management of Data. New York: ACM, 2007:67-78
8Du Yang, Xia Tian, Tao Yufei, et al. On multidimensional k-anonymity with local recoding generalization [C] //Proc of IEEE 23rd Int Conf on Data Engineering. Los Alamitos: IEEE Computer Society, 2007:1422-1424
9Tao Yufei, Xiao Xiaokui, Li Jiexing, et al. On anti corruption privacy preserving publication [C]//Proc of the 24th Int Conf on Data Engineering (ICDE). Los Alamitos: IEEE Computer Society, 2008:725-734
10Oliveira S R M, Zaiane O R. Privacy preservation when sharing data for clustering [C]//Proc of the Int Workshop on Secure Data Management in a Connected World. Berlin: Springer, 2004: 67-82

共引文献53

1张勇,倪巍伟,崇志宏,胡新平.基于邻域相关性的面向聚类数据扰动方法[J].计算机研究与发展,2011,48(S3):79-85. 被引量：1
2毛典辉,曹健,蔡强,李海生.情境感知的位置隐私保护方法研究进展[J].通信学报,2013,34(S1):230-234. 被引量：1
3张坤,李庆忠,史玉良.面向SaaS应用的数据组合隐私保护机制研究[J].计算机学报,2010,33(11):2044-2054. 被引量：35
4崇志宏,倪巍伟,刘腾腾,张勇.一种面向聚类的隐私保护数据发布方法[J].计算机研究与发展,2010,47(12):2083-2089. 被引量：13
5但鸣啸,刘洪伟,吴婷婷,肖岳,石雅强.移动商务中的隐私保护策略研究综述[J].中国电子商务,2010(12):264-264. 被引量：1
6韩建民,于娟,虞慧群,贾泂.面向数值型敏感属性的分级l-多样性模型[J].计算机研究与发展,2011,48(1):147-158. 被引量：23
7刘昭斌,刘文芝,顾君忠.位置感知的自适应隐私保护策略[J].计算机工程与设计,2011,32(3):839-841. 被引量：4
8徐勇,王浩,李东勤.数据发布领域匿名隐私保护相关技术研究[J].情报杂志,2011,30(8):128-133. 被引量：2
9徐勇,丁忠明,司凤山.基于频繁项集发现的匿名隐私保护算法[J].计算机应用研究,2011,28(10):3828-3830.
10贡晓静,钟诚,华蓓.基于等距变换的聚类挖掘敏感信息保护方法[J].计算机工程,2011,37(19):122-125. 被引量：4

同被引文献295

1范海潮,顾理平.探寻平衡之道:隐私保护中知情同意原则的实践困境与修正[J].新闻与传播研究,2021(2):70-85. 被引量：43
2沈伟伟.论数字紧急状态的恢复机制——以新冠疫情防控为例[J].清华法学,2021,15(2):121-142. 被引量：27
3孟小峰,王雷霞,刘俊旭.人工智能时代的数据隐私、垄断与公平[J].大数据,2020,6(1):35-46. 被引量：16
4武毅,王丹,蒋宗礼.基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法[J].计算机研究与发展,2013,50(S1):248-256. 被引量：7
5潘晓,肖珍,孟小峰.位置隐私研究综述[J].计算机科学与探索,2007,1(3):268-281. 被引量：65
6俞迪.支持隐私保护的数据挖掘研究[D].长沙:湖南大学,2009.
7闫红蕾,曾文火,卫庆军,曹传生.Pocket PC与SQL Server数据库同步移动数据的研究[J].科学技术与工程,2007,7(18):4746-4749. 被引量：3
8Sweeney L. Kvanonymity , A model for protecting privacy [J]. International Journal of Uncertainty Fuzziness and Knowledge Based Systems. 2002. 10(5): 557-570.
9Machanava//hala A. Kifer D. Gehrke J, et al. Lediversity , Privacy beyond k-anonymity [J]. ACM Trans on Knowledge Discovery from Data (TKDD). 2007. 1(1): 1-3.
10Fung B C M. Wang K. Chen R. et al. Privacy preserving data publishing: A survey of recent developments [J]. Computing. 2010. 5(4): 1-53.

引证文献17

1刘晓娜,杜永文,蔺国梁.移动数据库中组合视图对隐私保护的应用[J].计算机光盘软件与应用,2013,16(13):13-14. 被引量：1
2刘晓娜,马少斌,王栋.移动数据库中基于k-匿名的隐私保护模型研究[J].计算机光盘软件与应用,2013,16(14):149-150.
3欧阳佳,印鉴,刘少鹏,刘玉葆.一种有效的差分隐私事务数据发布策略[J].计算机研究与发展,2014,51(10):2195-2205. 被引量：13
4刘雅辉,张铁赢,靳小龙,程学旗.大数据时代的个人隐私保护[J].计算机研究与发展,2015,52(1):229-247. 被引量：263
5张晓琳,王萍,郭彦磊,王静宇.社会网络子集(θ,k)-匿名方法[J].计算机应用,2015,35(8):2178-2183.
6刘东业.试析大数据时代个人隐私安全问题[J].电脑编程技巧与维护,2015(16):93-94. 被引量：1
7程舒通,徐从富,但红卫.基于粒度计算的减量式隐私保护数据挖掘[J].计算机应用研究,2015,32(11):3264-3268. 被引量：2
8刘彩云,刘志锋,戴百林.互联网时代的个人隐私保护[J].电脑知识与技术,2016,0(1):43-44.
9范晓峰,闫凤,刘洋.大数据云环境下TDS和BUG混合k-匿名化方法[J].电信科学,2016,32(7):90-96.
10杨波.大数据环境下个人隐私保护机制[J].软件导刊,2016,15(8):168-170. 被引量：3

二级引证文献313

1李坪.大数据赋权正当性证成[J].中山大学法律评论,2020(1):3-21. 被引量：1
2王晓蓉.大数据时代我国啦啦操运动发展的契机与困境[J].运动精品,2019,0(11):87-89. 被引量：5
3李昱.“去识别化的个人信息”不受刑法保护吗?[J].刑事法评论,2019(1):656-692. 被引量：2
4何小华.大数据在体育教学方面的应用现状[J].体育视野,2020(3):34-36. 被引量：1
5冯超.基于场域-惯习理论的体育运动技能能力评估模型构建[J].商丘师范学院学报,2021,37(6):14-17. 被引量：1
6丰霏,陈天翔.“推测信息”的权利属性及其法律规制[J].人权研究（辑刊）,2020(1):195-222.
7翁振超.浅谈大数据时代下的安全隐私与保护[J].计算机产品与流通,2020(11):210-210. 被引量：2
8卢文,李霞.大数据时代不正当价格行为的规制及用户个人隐私保护研究[J].互联网金融法律评论,2018(2):83-96. 被引量：2
9赖国书,上官霞.新技术发展趋势与电力营销信息技术创新应用探讨[J].中国科技纵横,2018,0(6):160-162.
10汪毅,江艺,王运增.医源性肠瘘的外科治疗(附32例报告)[J].右江民族医学院学报,2000,22(2):249-250.

1秦晓薇,门爱华,邹妍.基于K-匿名的隐私保护算法研究[J].赤峰学院学报（自然科学版）,2010,26(5):14-16. 被引量：2
2刘海.基于差异化聚类的分级隐私保护数据发布方法[J].海南师范大学学报（自然科学版）,2014,27(1):23-26.
3汪厚祥,李卉,刘霞.网际访问控制研究[J].舰船电子工程,2005,25(2):62-65. 被引量：2
4自己.怎一个惨字了得空白页的“另类”被改[J].网友世界,2004(9):33-33.
5陈桂鑫.分身有术一个图标当八个用[J].电脑迷,2006,0(15):78-78.
6长歌当哭.玩转Flash·在 PowerPoint中插入Flash动画[J].计算机应用文摘,2004(9).
7月生,周安利.远程教育正在走近我们[J].中国计算机用户,2001(10):63-65. 被引量：1
8花之神明.发掘桌面图标的使用潜力[J].网友世界,2010(17):24-25.
9张旭军.咋样建&如何选IDC——电信行业系列报道之一[J].中国计算机用户,2001(12):55-56.
10张树忠.我的文档有三巧[J].电脑迷,2007,0(13):15-15.

计算机研究与发展

2012年第5期

浏览历史

内容加载中请稍等...

一种考虑属性权重的隐私保护数据发布方法被引量：17

参考文献16

二级参考文献40

共引文献53

同被引文献295

引证文献17

二级引证文献313

相关作者

相关机构

相关主题

浏览历史

一种考虑属性权重的隐私保护数据发布方法 被引量：17

参考文献16

二级参考文献40

共引文献53

同被引文献295

引证文献17

二级引证文献313

相关作者

相关机构

相关主题

浏览历史

一种考虑属性权重的隐私保护数据发布方法被引量：17