基于敏感信息邻近抵抗的匿名方法被引量：5

Anonymity Method Based on Proximity Resistance to Sensitive Information

下载PDF

导出

摘要针对相似性攻击造成隐私泄露的问题,构建一种(r,k)-匿名模型,基于敏感属性语义关联,设定邻近抵抗阈值r,并提出满足该模型的匿名方法GDPPR。采用模糊聚类技术完成簇的划分,结合敏感属性相异度得出距离矩阵,使得每个等价类中相邻语义下的敏感属性取值频率不高于阈值r,同时保证较高的数据可用性。在两个标准数据集上的实验结果表明,该方案能够较好地满足(r,k)-匿名模型,有效抵抗相似性攻击,减少泛化产生的信息损失。 In view of the problem of the privacy leakage caused by similarity attacks,this paper proposes a(r,k)-anonymous model.Based on the semantic association between sensitive attributes,the proximity resistance threshold r is set,and an anonymous method Generalized Data for Privacy Proximity Resistance(GDPPR)that satisfies the model is designed.The fuzzy clustering technique is used to complete the cluster partitioning,and the distance matrix is obtained by combining the dissimilarity of sensitive attributes.Therefore,the frequency of taking values of sensitive attributes under the proximity semantics in each equivalence class is kept under the threshold r and the data availability is ensured.Experimental results on two standard datasets show that GDPPR can satisfy the(r,k)-anonymity model.It effectively resists similarity attacks,and reduces the information loss caused by generalization.

作者桂琼吕永军程小辉 GUI Qiong;Lü Yongjun;CHENG Xiaohui(College of Information Science and Engineering,Guilin University of Technology,Guilin,Guangxi 541004,China;School of Information Engineering,Wuhan University of Technology,Wuhan 430070,China)

机构地区桂林理工大学信息科学与工程学院武汉理工大学信息工程学院

出处《计算机工程》 CAS CSCD 北大核心 2020年第12期142-149,184,共9页 Computer Engineering

基金国家自然科学基金地区科学基金项目(61862019) 广西自然科学基金面上项目(2017GXNSFAA198223)。

关键词数据匿名相似性攻击模糊聚类邻近抵抗数据泛化 data anonymity similar attack fuzzy clustering proximity resistance data generalization

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1廖军,蒋朝惠,郭春,平源.一种基于权重属性熵的分类匿名算法[J].计算机科学,2017,44(7):42-46. 被引量：19
2姜火文,曾国荪,马海英.面向表数据发布隐私保护的贪心聚类匿名方法[J].软件学报,2017,28(2):341-351. 被引量：26
3贾俊杰,陈露婷.抵制敏感属性相似性攻击的(p,k,d)-匿名模型[J].计算机工程,2018,44(3):132-137. 被引量：5
4周水庚,李丰,陶宇飞,肖小奎.面向数据库应用的隐私保护研究综述[J].计算机学报,2009,32(5):847-861. 被引量：221
5龚奇源,杨明,罗军舟.面向关系-事务数据的数据匿名方法[J].软件学报,2016,27(11):2828-2842. 被引量：4
6龚奇源,杨明,罗军舟.面向缺失数据的数据匿名方法[J].软件学报,2013,24(12):2883-2896. 被引量：5

二级参考文献94

1罗永龙,黄刘生,荆巍巍,姚亦飞,陈国良.一个保护私有信息的布尔关联规则挖掘算法[J].电子学报,2005,33(5):900-903. 被引量：33
2葛伟平,汪卫,周皓峰,施伯乐.基于隐私保护的分类挖掘[J].计算机研究与发展,2006,43(1):39-45. 被引量：20
3杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
4张鹏,童云海,唐世渭,杨冬青,马秀莉.一种有效的隐私保护关联规则挖掘方法[J].软件学报,2006,17(8):1764-1774. 被引量：53
5张锋,常会友.基于分布式数据的隐私保持协同过滤推荐研究[J].计算机学报,2006,29(8):1487-1495. 被引量：17
6羌卫中,邹德清,金海.网格环境中证书和策略的隐私保护机制研究[J].计算机研究与发展,2007,44(1):11-19. 被引量：11
7Han J, Kamber M. Data Mining: Concepts and Techniques. 2nd Edition, San Francisco: Morgan Kaufmann Publishers, 2006
8Agrawal D, Aggarwal C C. On the design and auantification of privacy preserving data mining atgorithms//Proceedings of the Symposium on Principles of Database Systems (PODS). Santa Barbara, California, USA, 2001:247-255
9Verykios V S, Bertino E, Fovino I N, Provenza I N, Saygin Y, Theodoridis Y. State-of-the-art in privacy preserving data mining. ACM SIGMOD Record, 2004, 3(1): 50-57
10Agrawal R, Srikant R. Privacy preserving data mining//Proceedings of the ACM SIGMOD Conference on Management of Data (SIGMOD). Dallas, Texas, 2000:439-450

共引文献268

1冯超.基于场域-惯习理论的体育运动技能能力评估模型构建[J].商丘师范学院学报,2021,37(6):14-17. 被引量：1
2王一蕾,吴英杰,唐庆明.基于混合划分技术的隐私保护关系型数据发布算法[J].南京理工大学学报,2013,37(4):493-499. 被引量：2
3张勇,倪巍伟,崇志宏,胡新平.基于邻域相关性的面向聚类数据扰动方法[J].计算机研究与发展,2011,48(S3):79-85. 被引量：1
4武毅,王丹,蒋宗礼.基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法[J].计算机研究与发展,2013,50(S1):248-256. 被引量：7
5万绪江,刘晓东,李洋.基于数据库管理安全的研究[J].气象与环境学报,2009,25(5):57-61. 被引量：6
6王平水,王建东.匿名化隐私保护技术研究进展[J].计算机应用研究,2010,27(6):2016-2019. 被引量：10
7兰丽辉,鞠时光,金华,刘善成.数据发布中的隐私保护研究综述[J].计算机应用研究,2010,27(8):2822-2827. 被引量：14
8申艳光,邵慧,张永强.隐私保护的分布式决策树分类算法的研究[J].计算机应用研究,2010,27(8):3070-3072. 被引量：4
9朱青,赵桐,王珊.面向查询服务的数据隐私保护算法[J].计算机学报,2010,33(8):1315-1323. 被引量：33
10刘腾腾,倪巍伟,崇志宏,张勇.多维数值敏感属性隐私保护数据发布方法[J].东南大学学报（自然科学版）,2010,40(4):699-703. 被引量：6

同被引文献35

1张岐山,郑丽君.基于灰关联分析的V-MDAV算法研究[J].计算机应用研究,2020,37(1):107-111. 被引量：3
2李永红,汪盈,李腊全,赵志强.一种改进的特征选择算法在邮件过滤中的应用[J].计算机科学,2022,49(S02):740-744. 被引量：4
3王平水,王建东.一种基于聚类的个性化(l,c)-匿名算法[J].计算机工程与应用,2012,48(23):16-20. 被引量：4
4桂琼,程小辉.基于聚类的分级匿名方法[J].计算机应用,2013,33(2):412-416. 被引量：4
5杨高明,李敬兆,杨静,朱广丽.(k,l)-多样性数据发布研究[J].计算机科学,2013,40(8):140-145. 被引量：4
6张健沛,谢静,杨静,张冰.基于敏感属性值语义桶分组的t-closeness隐私模型[J].计算机研究与发展,2014,51(1):126-137. 被引量：14
7冯登国,张敏,李昊.大数据安全与隐私保护[J].计算机学报,2014,37(1):246-258. 被引量：724
8钟浙云,韩建民,王海元,陈新驰.抵制敏感属性近似攻击的(k,l,e)-匿名模型[J].小型微型计算机系统,2014,35(7):1491-1495. 被引量：4
9杨静,王超,张健沛.基于敏感属性熵的微聚集算法[J].电子学报,2014,42(7):1327-1337. 被引量：14
10刘雅辉,张铁赢,靳小龙,程学旗.大数据时代的个人隐私保护[J].计算机研究与发展,2015,52(1):229-247. 被引量：262

引证文献5

1高帅,徐雅斌,武装.一种抗相似性攻击的匿名保护方法[J].北京信息科技大学学报（自然科学版）,2020,35(4):63-68.
2冷建宇,郭永安.一种医疗数据发布匿名化模型[J].工业控制计算机,2021,34(4):60-62.
3唐朝生,李鹏飞,王辉,王成杰,申自浩.面向位置服务的K-Vretr隐私保护方法[J].小型微型计算机系统,2022,43(1):165-172. 被引量：1
4冯健文,林璇.基于词义特性的电子邮件敏感信息过滤仿真[J].计算机仿真,2023,40(10):210-213.
5石昆正,张攀峰,董明刚.基于敏感分级信息熵的匿名方法[J].计算机应用与软件,2024,41(5):319-326.

二级引证文献1

1金伟民,张逸凡,张淑丽.面向大数据的隐私保护系统研究[J].现代信息科技,2022,6(7):18-21.

1王舒洋,慕晓冬,贺浩,杨东方,马晨晖.航拍图像跨数据域特征迁移道路提取方法[J].测绘学报,2020,49(5):611-621. 被引量：5
2陆康,刘慧,任贝贝,杜健.基于PPDM的智慧图书馆用户隐私数据保护研究[J].现代情报,2020,40(10):93-103. 被引量：18
3黄保华,程琪,袁鸿,黄丕荣.一种差分隐私K-means聚类算法的隐私预算分配方案[J].网络空间安全,2020,11(11):11-19.
4姜枫,顾庆,郝慧珍,李娜,胡修棉.基于语义特征提取的砂岩薄片图像颗粒分割方法[J].中国科学：信息科学,2020,50(1):109-127. 被引量：9
5刘洲洲,尹文晓,张倩昀,彭寒.基于离散优化算法和机器学习的传感云入侵检测[J].吉林大学学报（工学版）,2020,50(2):692-702. 被引量：10
6张王策,范菁,王渤茹,倪旻.面向缺损数据的(α,k)-匿名模型[J].计算机科学,2020,47(S01):395-399. 被引量：2
7周让,张小松,汪小芬,杨国武,杜小江.公钥可搜索加密及其在物联网环境下的应用研究进展[J].广州大学学报（自然科学版）,2020,19(2):12-23.
8裴炜旻.基于粗糙集的医院智能仪器数据库安全访问方法[J].自动化与仪器仪表,2020(4):175-178.
9孙志冉,苏航,梁毅.一种改进的K-Prototypes聚类算法[J].计算机工程与应用,2020,56(21):54-59. 被引量：4
10郑建华,黄灏然,李晓龙.基于大数据小微企业信用评级模型研究[J].技术经济与管理研究,2020(7):22-26. 被引量：8

计算机工程

2020年第12期

浏览历史

内容加载中请稍等...

基于敏感信息邻近抵抗的匿名方法被引量：5

参考文献6

二级参考文献94

共引文献268

同被引文献35

引证文献5

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于敏感信息邻近抵抗的匿名方法 被引量：5

参考文献6

二级参考文献94

共引文献268

同被引文献35

引证文献5

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于敏感信息邻近抵抗的匿名方法被引量：5