基于可伸缩l-多样性的大数据发布隐私保护被引量：7

Big data publishing privacy protection based on scalable l-diversity

下载PDF

导出

摘要针对非结构化大数据发布中的隐私保护问题,提出了一种基于改进的可伸缩l-多样性(improved scalable l-diversity,Im SLD)大数据发布隐私保护方法。该算法采用基于两阶段条件随机场的命名实体识别(named entity recognition,NER)方法将非结构化数据表示为结构化形式,设计一种改进的可伸缩l-多样性算法来对表现良好的非结构化数据进行匿名化,实现保护非结构化大数据发布的隐私,通过Apache Pig实现Im SLD算法来使其具有可伸缩性。实验表明与MRA和SKA算法相比,改进的Im SLD算法在不同数据集上提供相同级别的隐私时信息损失均优于对比的另外两种算法。 Aiming at the problem of the privacy protection in unstructured big data publishing,this paper proposed a privacy protection method based on ImSLD big data publishing.The algorithm used the two-stage conditional random field NER method to represent unstructured data as a structured form,and designed an improved scalable l-diversity algorithm to perform well.It anonymized to structured data protect the privacy of unstructured big data distribution.It implemented the ImSLD algorithm by Apache Pig to make it scalable.Experiments show that compared with MRA and SKA algorithm,the improved ImSLD algorithm provides better information loss than the other two algorithms when providing the same level of privacy on different data sets.

作者邹劲松李芳 Zou Jinsong;Li Fang(Putian Big Data Industry School,Chongqing College of Water Resources&Electric Engineering,Chongqing 402160,China;School of Computer Science,Chongqing University,Chongqing 400044,China)

机构地区重庆水利电力职业技术学院普天大数据产业学院重庆大学计算机学院

出处《计算机应用研究》 CSCD 北大核心 2021年第2期564-566,571,共4页 Application Research of Computers

基金重庆市教育科学“十三五”规划2020年度重点无经费课题(2020-GX-169) 重庆市职业教育学会2020—2021年度立项课题(2020ZJXH282086)。

关键词大数据发布隐私保护 l-多样性 K-匿名非结构化大数据命名实体识别 privacy preserving big data publishing l-diversity k-anonymization unstructured big data named entity recognition

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1陈庄,齐锋.面向企业私有云的数据安全保护方法研究[J].计算机应用研究,2020,37(3):833-837. 被引量：8

二级参考文献12

1钟名富,胡予濮,陈杰.分组加密算法SMS4的14轮Square攻击[J].西安电子科技大学学报,2008,35(1):105-109. 被引量：11
2冯登国,张敏,张妍,徐震.云计算安全研究[J].软件学报,2011,22(1):71-83. 被引量：1067
3徐剑,周福才,陈旭,朱志良.云计算中基于认证数据结构的数据外包认证模型[J].通信学报,2011,32(7):153-160. 被引量：10
4周文婷,朱姣姣.DES加密算法的一种改进方法[J].计算机安全,2012(9):47-50. 被引量：7
5肖振久,胡驰,姜正涛,陈虹.AES与RSA算法优化及其混合加密体制[J].计算机应用研究,2014,31(4):1189-1194. 被引量：34
6张祎江.基于3DES-ECC算法的网络信息加密研究[J].科技通报,2014,30(4):229-231. 被引量：6
7王魁,李立新,余文涛,王冠众,王振.基于ECC算法的TLS协议设计与优化[J].计算机应用研究,2014,31(11):3486-3489. 被引量：6
8冯朝胜,秦志光,袁丁.云数据安全存储技术[J].计算机学报,2015,38(1):150-163. 被引量：138
9汪朝晖,张振峰.SM2椭圆曲线公钥密码算法综述[J].信息安全研究,2016,2(11):972-982. 被引量：88
10王小云,于红波.SM3密码杂凑算法[J].信息安全研究,2016,2(11):983-994. 被引量：71

共引文献7

1张颖,杜秀兰,阎晓强.基于云计算的市政建筑行业信息化建设应用研究[J].数码设计,2021,10(7):78-78.
2包伟华,王妍,赵荣泳,张浩,李咪渊,贾萍.面向工控安全的电动执行机构在线服务系统设计[J].自动化仪表,2021,42(7):83-86. 被引量：1
3刘志,刘平,祁红彦.基于私有云的安全射界图在线制作系统的构建[J].成都信息工程大学学报,2022,37(3):253-258.
4米捷,张凌超,高彦伟,张昕,阎永华,李政伟.基于私有云安全防护的网络密文数据防泄露方法[J].河南工程学院学报（自然科学版）,2022,34(3):48-53. 被引量：2
5龙草芳,肖衡.无线传感器网络分布式数据库加密方法研究[J].传感技术学报,2022,35(8):1131-1136. 被引量：3
6琚理,赵金币.基于卷积神经网络的文档有效数据加密仿真[J].计算机仿真,2022,39(10):440-444. 被引量：1
7邱扬,黄智勇,刘思煜,陈媛媛,许延杰,徐峰.基于国产云原生技术的医疗数据安全体系建设[J].现代医院,2023,23(12):1889-1893.

同被引文献66

1熊平,朱天清,王晓峰.差分隐私保护及其应用[J].计算机学报,2014,37(1):101-122. 被引量：174
2史汉发,王俊峰,陈建,王宇琛.医疗数据发布中多敏感属性隐私保护算法[J].四川大学学报（自然科学版）,2014,51(4):731-737. 被引量：4
3葛雨玮,康绯,彭小详.基于动态BP神经网络的恶意代码同源性分析[J].小型微型计算机系统,2016,37(11):2527-2531. 被引量：9
4白云璐.医疗大数据中应用差分隐私保护[J].电子技术与软件工程,2017(24):196-197. 被引量：3
5吴云乘,陈红,赵素云,梁文娟,吴垚,李翠平,张晓莹.一种基于时空相关性的差分隐私轨迹保护机制[J].计算机学报,2018,41(2):309-322. 被引量：27
6霍峥,孟小峰.一种满足差分隐私的轨迹数据发布方法[J].计算机学报,2018,41(2):400-412. 被引量：20
7郝雅娴,孙艳蕊.K-近邻矩阵分解推荐系统算法[J].小型微型计算机系统,2018,39(4):755-758. 被引量：12
8张双越,田丰,吴振强.一种基于差分隐私机制的自适应轨迹数据发布算法[J].陕西师范大学学报（自然科学版）,2018,46(5):9-15. 被引量：1
9LI Yongkai,LIU Shubo,LI Dan,WANG Jun.Release Connection Fingerprints in Social Networks Using Personalized Differential Privacy[J].Chinese Journal of Electronics,2018,27(5):1104-1110. 被引量：6
10王良,王伟平,孟丹.基于加权贝叶斯网络的隐私数据发布方法[J].计算机研究与发展,2016,53(10):2343-2353. 被引量：15

引证文献7

1李洪涛,任晓宇,王洁,马建峰.基于差分隐私的连续位置隐私保护机制[J].通信学报,2021,42(8):164-175. 被引量：11
2陈思阳.改进贝叶斯网络的个性化隐私数据发布方法[J].软件导刊,2021,20(9):213-216. 被引量：2
3王辉,廉芳芳,申自浩.结合四叉树划分的差分隐私位置发布算法[J].小型微型计算机系统,2021,42(11):2394-2399. 被引量：1
4张思琪,李晓会,江欣俞,李波.面向医疗数据的AUR-Tree差分隐私数据发布算法[J].计算机应用研究,2022,39(7):2162-2166. 被引量：1
5虞娟.基于混洗差分的Web查询大数据隐私保护方法[J].黑龙江工业学院学报（综合版）,2022,22(12):64-69. 被引量：2
6盛丹丹.基于大数据分析的隐私信息保护系统设计与实现[J].信息安全研究,2023,9(9):914-920. 被引量：1
7陈雪瓶,贺晓松.大数据安全与隐私保护关键技术研究[J].软件,2023,44(10):50-52.

二级引证文献17

1晏燕,丛一鸣,Adnan Mahmood,盛权政.基于深度学习的位置大数据统计发布与隐私保护方法[J].通信学报,2022,43(1):203-216. 被引量：8
2左开中,刘蕊,赵俊,谌章义,陈付龙.融合语义信息的时空关联位置隐私保护方法[J].西安电子科技大学学报,2022,49(1):67-77. 被引量：7
3暴婷,徐蕾,祝烈煌,王丽宏.满足本地化差分隐私的推荐系统中隐私预算的优化设置[J].中国科学：信息科学,2022,52(8):1481-1499.
4张俊,刘德安,申自浩,王辉,刘沛骞.面向轨迹数据发布的KSDP方案[J].深圳大学学报（理工版）,2023,40(2):236-243.
5余意.动态分类树构造下的自适应差分隐私数据发布算法[J].重庆科技学院学报（自然科学版）,2023,25(3):81-85. 被引量：1
6杨囡囡,宋成.K-匿名批量认证的位置隐私保护机制[J].重庆邮电大学学报（自然科学版）,2023,35(3):468-473.
7石雪松,殷丽凤.基于贝叶斯网络的隐私数据研究[J].信息技术与信息化,2023(9):119-122.
8李雯萱,吴昊,李昌松.基于语义的位置隐私保护综述[J].计算机应用,2023,43(11):3472-3483.
9申艳梅,张玉阳,申自浩,王辉,刘沛骞.基于BIGRU的轨迹数据发布隐私保护方案[J].重庆邮电大学学报（自然科学版）,2023,35(6):1011-1019.
10骆海霞.基于递推估计的Web前端偶发任务能耗感知方法[J].黑龙江工业学院学报（综合版）,2023,23(10):115-120.

1张兴兰,杨文金.基于Fréchet距离函数的轨迹隐私保护方法[J].北京工业大学学报,2021,47(2):127-134.
2孙刚.大数据驱动下业财融合导向的管理会计人才培养机制创新[J].财会月刊,2021(2):88-93. 被引量：62
3贾俊杰,秦海涛.基于遗传算法的动态轨迹匿名算法[J].计算机工程与科学,2021,43(1):142-150. 被引量：2
4武亚丽.在股骨颈骨折护理中应用舒适护理的效果及患者的满意度分析[J].世界最新医学信息文摘,2020(28):221-221. 被引量：1
5李泽琛,司广涛,孟静.一种针对传染病接触者的远程监控和隐私保护方法[J].信息技术与网络安全,2021,40(2):14-18.
6张润莲,赵新红,武小年.一种防边权和语义攻击的位置隐私保护方法[J].计算机应用研究,2021,38(2):559-563. 被引量：2
7朱文昌,罗梦婷,倪广县,王恒.随机矩阵理论和主成分分析融合的滚动轴承性能退化评估方法[J].西安交通大学学报,2021,55(2):55-63. 被引量：11
8Yufeng Ding,Yanli Wang.Big government:The fight against the African Swine Fever in China[J].Journal of Biosafety and Biosecurity,2020,2(1):44-49.
9王雅,吉世涛,任宾.光纤陀螺仪第三闭环回路控制研究[J].电子产品世界,2021,28(2):81-84.
10谢雨洋,冯栩,喻文健,唐杰.基于随机化矩阵分解的网络嵌入方法[J].计算机学报,2021,44(3):447-461. 被引量：5

计算机应用研究

2021年第2期

浏览历史

内容加载中请稍等...

基于可伸缩l-多样性的大数据发布隐私保护被引量：7

参考文献1

二级参考文献12

共引文献7

同被引文献66

引证文献7

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于可伸缩l-多样性的大数据发布隐私保护 被引量：7

参考文献1

二级参考文献12

共引文献7

同被引文献66

引证文献7

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于可伸缩l-多样性的大数据发布隐私保护被引量：7