基于局部划分的匿名算法研究被引量：3

Anonymous algorithm based on local partition

下载PDF

导出

摘要针对泛化会造成数据信息损失量较大,且该缺陷会随数据维度变大而越明显的问题,提出一种基于局部划分的匿名算法。在确保k-匿名和l-多样性的前提下,基于敏感属性栏值约束和记录间距离将数据表横向分成若干个桶,然后对每个桶基于属性间的关联纵向分成多栏,最后对同一桶中各栏中的数据进行随机重排。实验结果表明,在处理高维数据时,与LGAA-CP算法相比,信息损失量减少了47%~183%,关联关系保留率提高了24%~118%。与Slicing算法相比,信息损失量相差在1.5%之内,关联关系保留率提高了8.9%~22.8%。通过分析,该算法在同时确保高维数据的隐私保护能力和数据可用性方面是有效的。 Aiming at the problem that the generalization causes a large amount of loss of data information,and this defect would become more obvious as the data dimension becomes larger.This paper proposed an anonymous algorithm based on local partitioning.To ensure k-anonymity and l-diversity,based on the value constraint of sensitive attribute column and the distance between records,it horizontally divided the data table into several buckets.And then based on the relationship between the attributes,it longitudinally divided the buckets into multiple columns.Finally,it randomly rearranged the columns in the same bucket.The experimental results show that when dealing with high dimensional data,compared with LGAA-CP algorithm,it reduces the loss of information by 47%to 183%,and increases the retention rate of the relationship by 24%to 118%.Compared with the slicing algorithm,the loss of information between the two is within 1.5%,and it increases the retention rate of the association by 8.9%to 22.8%.The analysis shows that the algorithm is effective in ensuring both high-dimensional data privacy protection and data availability.

作者王芳余敦辉张万山 Wang Fang;Yu Dunhui;Zhang Wanshan(School of Computer Science & Information Engineering,Hubei University,Wuhan 430062,China;Hubei Education Information Engineering & Technology Research Center,Wuhan 430062,China)

机构地区湖北大学计算机与信息工程学院湖北省教育信息化工程技术研究中心

出处《计算机应用研究》 CSCD 北大核心 2019年第10期3048-3053,共6页 Application Research of Computers

基金国家重点研发计划资助项目(2016YFB0800401) 国家“973”计划资助项目(2014CB340404) 国家自然科学基金资助项目(61373037,61672387) 湖北省重大专项资助项目(2018ACA133)

关键词数据发布隐私保护 K-匿名 l-多样性敏感属性栏值约束 privacy-preserving data publishing k-anonymity l-diversity sensitive attribute column value constraint

分类号 TP309.2 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献9

1武毅,王丹,蒋宗礼.基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法[J].计算机研究与发展,2013,50(S1):248-256. 被引量：7
2冯登国,张敏,李昊.大数据安全与隐私保护[J].计算机学报,2014,37(1):246-258. 被引量：719
3刘雅辉,张铁赢,靳小龙,程学旗.大数据时代的个人隐私保护[J].计算机研究与发展,2015,52(1):229-247. 被引量：261
4张健沛,谢静,杨静,张冰.基于敏感属性值语义桶分组的t-closeness隐私模型[J].计算机研究与发展,2014,51(1):126-137. 被引量：14
5徐勇,秦小麟,杨一涛,杨种学,黄灿.一种考虑属性权重的隐私保护数据发布方法[J].计算机研究与发展,2012,49(5):913-924. 被引量：17
6李珊珊,朱玉全,陈耿.基于聚类的数据敏感属性匿名保护算法[J].计算机应用研究,2012,29(2):469-471. 被引量：4
7廖军,蒋朝惠,郭春,平源.一种基于权重属性熵的分类匿名算法[J].计算机科学,2017,44(7):42-46. 被引量：19
8姜火文,曾国荪,马海英.面向表数据发布隐私保护的贪心聚类匿名方法[J].软件学报,2017,28(2):341-351. 被引量：25
9王良,王伟平,孟丹.基于加权贝叶斯网络的隐私数据发布方法[J].计算机研究与发展,2016,53(10):2343-2353. 被引量：15

二级参考文献139

1杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
2姜传贤,孙星明,易叶青,杨恒伏.基于JADE算法的数据库公开水印算法的研究[J].系统仿真学报,2006,18(7):1781-1784. 被引量：9
3SWEENEY L. K-anonymity: a model for protecting privacy[ J]. In- ternational Journal of Uncertainty, Fuzziness and Knowledge- based Systems,2002,10 (5) :557- 570.
4MACHANAVAJJHALA A, GEHRKE J, KIFER D. L-diversity: pri- vacy beyond k-anonymity[ J]. ACM Trans on Knowledge Disco- very from Data,2007,1 (1) :24-35.
5LEFEVRE K, DEWITrD J, RAMAKRISHNAN R. Incognito: effi- cient full-domain k-anonymity [ C ]//Proc of ACM SIGMOD Interna- tional Conference on Management of Data. New York: ACM Press, 2005,49-60.
6AGGARWAL G, FEDER T, KENTHAPADI T, et al. Achieving ano- nymity via clustering[ C ]//Proc of Symposium on Principles of Data- base Systems. New York: ACM Press, 2006 : 153-162.
7BYUN J W, KAMRA A, BERTINO E, et al. Efficient k-anonymiza- tion using clustering techniques [ C ]//Proc of the 12th International Conference on Database Systems for Advanced Applications. Berlin: Springer-Verlag, 2007 : 188- 200.
8LI Jiu-yong, WONG R C W, FU A W C, et al. Achieving k-anony- mity by clustering in attribute hierarchical structures[ C~//Proc of the 8th International Conference on Data Warehousing and Knowledge Discovery. 2006:405- 416.
9LIN Jun-lin, WEI Meng-cheng. Genetic algorithm-based clustering approach for k-anonymization [ J ]. Expert Systems with Applica- tions,2009,36(6) :9784-9792.
10LU Li-jian, YE Xiao-jun. An improved weighted-feature clustering algorithm for k-anonymity [ C ]//Proc of the 5th International Confe- rence on Information Assurance and Security. Washington DC: IEEE Computer Society, 2009:415-419.

共引文献1015

1李坪.大数据赋权正当性证成[J].中山大学法律评论,2020(1):3-21. 被引量：1
2王晓蓉.大数据时代我国啦啦操运动发展的契机与困境[J].运动精品,2019,0(11):87-89. 被引量：4
3张小玉,沈国华,杨阳.基于属性分割的差分隐私异构多属性数据发布[J].计算机系统应用,2022,31(10):225-235.
4李昱.“去识别化的个人信息”不受刑法保护吗?[J].刑事法评论,2019(1):656-692. 被引量：1
5张旭昱,李琛.基于“隐私悖论”的社交媒体用户隐私保护探究[J].新媒体研究,2023,9(7):50-53.
6娄豪,李晓东,刘晶,金鑫.物流用户隐私信息保护系统[J].北京电子科技学院学报,2019,27(4):18-25. 被引量：1
7何小华.大数据在体育教学方面的应用现状[J].体育视野,2020(3):34-36. 被引量：1
8操凡.云环境下金融通信信息安全的加密技术研究[J].中国新通信,2020,22(3):44-45.
9冯超.基于场域-惯习理论的体育运动技能能力评估模型构建[J].商丘师范学院学报,2021,37(6):14-17. 被引量：1
10丰霏,陈天翔.“推测信息”的权利属性及其法律规制[J].人权研究（辑刊）,2020(1):195-222.

同被引文献24

1刘历波,赵廷廷,李彦苍,王斌.基于信息熵的改进鲸鱼优化算法[J].数学的实践与认识,2020,0(2):211-219. 被引量：2
2吴振强,马建峰.基于联合熵的多属性匿名度量模型[J].计算机研究与发展,2006,43(7):1240-1245. 被引量：9
3冯登国,张敏,李昊.大数据安全与隐私保护[J].计算机学报,2014,37(1):246-258. 被引量：719
4熊平,朱天清,顾霄.基于信息增益比例约束的数据匿名方法及其评估机制[J].计算机应用研究,2014,31(3):819-824. 被引量：2
5李永凯,刘树波,杨召唤,刘梦君.MSN中用户属性隐私安全的选择性匹配协议[J].华中科技大学学报（自然科学版）,2015,43(5):89-94. 被引量：1
6苏洁,刘帅,罗智勇,孙广路.基于信息损失量估计的匿名图构造方法[J].通信学报,2016,37(6):56-64. 被引量：5
7彭长根,丁红发,朱义杰,田有亮,符祖峰.隐私保护的信息熵模型及其度量方法[J].软件学报,2016,27(8):1891-1903. 被引量：56
8王威,李楠.大数据时代个人隐私防范与保护策略研究[J].网络空间安全,2017,8(4):9-13. 被引量：10
9龙文,蔡绍洪,焦建军,唐明珠,伍铁斌.求解大规模优化问题的改进鲸鱼优化算法[J].系统工程理论与实践,2017,37(11):2983-2994. 被引量：114
10朱涛,郭进伟,周欢,周烜,周傲英.分布式数据库中一致性与可用性的关系[J].软件学报,2018,29(1):131-149. 被引量：37

引证文献3

1郑明辉,杨晨,谭杰,吕含笑.相同敏感值数据表泛化算法的安全性度量研究[J].网络空间安全,2019,10(6):88-94.
2陈思阳.改进贝叶斯网络的个性化隐私数据发布方法[J].软件导刊,2021,20(9):213-216. 被引量：2
3龙草芳,肖衡.无线传感器网络分布式数据库加密方法研究[J].传感技术学报,2022,35(8):1131-1136. 被引量：3

二级引证文献5

1赵健.基于hadoop的舰船通信网络数据并行处理方法[J].舰船科学技术,2023,45(7):158-161.
2石雪松,殷丽凤.基于贝叶斯网络的隐私数据研究[J].信息技术与信息化,2023(9):119-122.
3程大勇.基于区块链的敏感数据库属性加密算法[J].通化师范学院学报,2024,45(2):104-110.
4龙慧萍.基于国密算法的地勘单位测绘地理信息安全加密方法[J].自动化技术与应用,2024,43(4):85-88.
5卢晓天,朴春慧,杨兴雨,白英杰.基于贝叶斯网络的差分隐私高维数据发布技术研究[J].计算机工程,2024,50(5):167-181.

1孙玲.大数据下的位置隐私保护技术的研究[J].网络安全技术与应用,2019(8):66-67. 被引量：2
2本刊编辑部.2018年CSCD-JCR数据发布《水资源保护》取得显著进步[J].水资源保护,2019,35(5):12-12.
3高剑.面向数据发布的差分隐私保护技术研究[J].移动信息,2019(1):73-76.
4黄俊红,钟宪彭,蒋东辉.牙周牙髓联合病变患牙的联合治疗效果[J].世界最新医学信息文摘,2019,0(58):122-123. 被引量：1
5信息技术创新[J].网络安全和信息化,2019,0(9):26-26.
6ICCA-CIETAC投资仲裁实务问题研讨会[J].中国律师,2019,0(5):2-2.
7王思平.论水稻超高产栽培的途径与技术[J].农民致富之友,2019,0(28):17-17.
8卢歆雨,朱玥琪.郑州市创新创业高端人才引进战略研究[J].创新创业理论研究与实践,2019,2(12):5-8.
9顾超.冷却塔电加热器功率的选型计算方法[J].安装,2019,0(9):46-47. 被引量：1
10钟亚雯.基于AHP-RST的项目群进度风险的研究[J].新材料·新装饰,2019,1(1):6-8.

计算机应用研究

2019年第10期

浏览历史

内容加载中请稍等...

基于局部划分的匿名算法研究被引量：3

参考文献9

二级参考文献139

共引文献1015

同被引文献24

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于局部划分的匿名算法研究 被引量：3

参考文献9

二级参考文献139

共引文献1015

同被引文献24

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于局部划分的匿名算法研究被引量：3