面向高维数据发布的差分隐私算法及应用综述

Survey of Differential Privacy Algorithms and Applications for High-Dimensional Data Publishing

下载PDF

导出

摘要随着大数据和机器学习技术的进一步发展,处理具有几十上百维特征的复杂结构和关系且蕴含丰富语义信息的高维数据成为一项挑战。在保障个人隐私不被泄露的前提下,如何安全地使用这些高维数据,成为当前的一个重要话题。我们查阅资料发现:关于差分隐私技术本身的综述很多,但是面向高维数据发布的差分隐私算法及应用的综述却很少。基于此,本文通过对差分隐私在高维数据领域的应用进行综述,深入了解不同方法在保护高维数据隐私方面的优劣,并指导面向高维数据发布的差分隐私算法未来研究的方向,从而更好地应对隐私保护和数据分析的挑战。本文首先介绍了差分隐私的原理和特性,总结了当前差分隐私技术本身的研究工作。然后从数据降维和数据合成两个角度分析了差分隐私在高维数据环境中的应用,探讨了差分隐私面临的问题和挑战,并提出了初步的解决方法,旨在更好地解决当前高维数据保护和使用的问题。最后,本文提出了未来可能的研究方向以促进技术交流,推动差分隐私在高维数据应用中的进一步突破。 With the further development of big data and machine learning technologies,handling high-dimensional data with complex structures,relationships,and rich semantic information containing dozens to hundreds of features has become a challenge.Safely utilizing such high-dimensional data,while ensuring the privacy of individuals,has become a significant topic today.Upon reviewing existing literature,we found numerous reviews on differential privacy technology itself,but few on the algorithms and applications of differential privacy specifically tailored for high-dimensional data.Therefore,this paper provides a review of the application of differential privacy in the field of high-dimensional data,aiming to delve into the strengths and weaknesses of different methods in protecting the privacy of high-dimensional data and to guide future research directions for differential privacy algorithms tailored for high-dimensional data publishing.Firstly,this paper introduces the principles and characteristics of differential privacy,summarizing the current research work on the technology itself.Then,it analyzes the application of differential privacy in high-dimensional data environments from the perspectives of data dimensionality reduction and data synthesis,discussing the challenges and issues faced by differential privacy and proposing preliminary solutions to better address the issues of privacy protection and data analysis in the current high-dimensional data landscape.Lastly,potential future research directions are proposed to facilitate technological exchange and further advancements in the application of differential privacy in high-dimensional data settings.

作者龙春秦泽秀李丽莎李婧杨帆魏金侠付豫豪 LONG Chun;QIN ZeXiu;LI LiSha;LI Jing;YANG Fan;WEI JinXia;FU YuHao(Computer Network Information Center,Chinese Academy of Sciences,Beijing 100083,China;University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区中国科学院计算机网络信息中心中国科学院大学

出处《农业大数据学报》 2024年第2期170-184,共15页 Journal of Agricultural Big Data

基金国家重点研发计划:金融数据全周期流转安全风险评估监测与溯源技术研究(2023YFC3304704) 中国科学院网络安全和信息化专项(CASWX2022GC-04) 中国科学院青年创新促进会项目(2022170)。

关键词差分隐私高维数据扰动机制隐私分配 differential privacy high-dimensional data perturbation mechanism privacy allocation

分类号 TP309 [自动化与计算机技术—计算机系统结构] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献14

1刘俊旭,孟小峰.机器学习的隐私保护研究综述[J].计算机研究与发展,2020,57(2):346-362. 被引量：65
2孔钰婷,谭富祥,赵鑫,张正航,白璐,钱育蓉.基于差分隐私的K-means算法优化研究综述[J].计算机科学,2022,49(2):162-173. 被引量：7
3王腾,霍峥,黄亚鑫,范艺琳.联邦学习中的隐私保护技术研究综述[J].计算机应用,2023,43(2):437-449. 被引量：13
4蔡梦男,沈国华,黄志球,杨阳.本地差分隐私下的高维数据发布方法[J].计算机科学,2024,51(2):322-332. 被引量：1
5张兴,陈昊.差分隐私的高维数据发布研究综述[J].智能系统学报,2021,16(6):989-998. 被引量：4
6叶青青,孟小峰,朱敏杰,霍峥.本地化差分隐私研究综述[J].软件学报,2018,29(7):1981-2005. 被引量：68
7高志强,王宇涛.差分隐私技术研究进展[J].通信学报,2017,38(A01):151-155. 被引量：15
8赵禹齐,杨敏.差分隐私研究进展综述[J].计算机科学,2023,50(4):265-276. 被引量：3
9李杨,温雯,谢光强.差分隐私保护研究综述[J].计算机应用研究,2012,29(9):3201-3205. 被引量：40
10陈怡.健康医疗数据共享与个人信息保护研究[J].情报杂志,2023,42(5):192-199. 被引量：18

二级参考文献132

1何玲,吴限.全国“信易贷”平台取得四方面积极成效[J].中国信用,2021(6):32-32. 被引量：1
2袁康.金融科技的技术风险及其法律治理[J].法学评论,2021,39(1):115-130. 被引量：56
3孙慧中,杨健宇,程祥,苏森.一种基于随机投影的本地差分隐私高维数值型数据收集算法[J].大数据,2020,6(1):3-11. 被引量：4
4SWEENEY L. ^-anonymity: a model for protecting privacy[ J ]. Inter-national Journal on Uncertainty, Fuzziness and Knowledge-based Systems,2002,10(5) :557-570.
5SWEENEY L. Achieving A>anonymity privacy protection using gener-alization and suppression[ J]. International Journal on Uncertainty,Fuzziness and Knowledge-based Systems, 2002,10(5) : 571-588.
6Li Ning-hui, LI Tian-cheng, VENKATASUBRAMANIAN S. (-closeness :privacy beyond A:-anonymity and /-diversity [ C ] //Proc of the 23rd International Conference on Data Engineering. Washington DC: IEEE Computer Society ,2007 :106-115.
7MACHANAVAJJHALA A,KIFER D, GEHRKE J, et al. /-diversity; privacy beyond A:-anonymity [ C ] //Proc of the 22nd International Conference on Data Engineering. Washington DC:IEEE Computer Society,2006 :24-35.
8CORMODE G,PROCOPIUC M,SRIVASTAVA D. et aL Differentially private publication of sparse data [ J ]. ArxiV Preprint arXiv : 1103. 0825,2011.
9SARATHY R,MURALIDHAR K. Some additional insights on applying differential privacy for numeric data [ C ]//Proc of International Conference on Privacy in Statistical Databases. Berlin : Springer-Ver-lag,2010:210-219.
10DWORK C, NAOR M,PITASSI T,et al. Pan-private streaming algorithms [C ] //Proc of the 1st Symposium on Innovations in Computer Science. Beijing:Tsinghua University Press, 2010.

共引文献233

1刘丹青,高瑜,吴振强.基于距离贡献率的隐私保护框架下k-medoids算法研究[J].青海师范大学学报（自然科学版）,2022,38(1):4-13.
2郭雅婷,赵佳,黄学臻,张强,孟祥雨.基于车雾环境的联邦学习动态隐私保护方案[J].中国电子科学研究院学报,2023,18(5):397-406.
3孟小峰,王雷霞,刘俊旭.人工智能时代的数据隐私、垄断与公平[J].大数据,2020,6(1):35-46. 被引量：16
4孙慧中,杨健宇,程祥,苏森.一种基于随机投影的本地差分隐私高维数值型数据收集算法[J].大数据,2020,6(1):3-11. 被引量：4
5曹云新,刘智广,张晓楠,董巨莹.流式细胞术外周血样品间标的方法[J].第四军医大学学报,2000,21(2):244-246. 被引量：4
6廖龙龙,叶强,路红.面向移动感知服务的数据隐私保护技术研究[J].计算机工程与设计,2013,34(6):1951-1955. 被引量：12
7李杨,郝志峰,肖燕珊,袁淦钊,谢光强.差分隐私DPE k-means数据聚合下的多维数据可视化[J].小型微型计算机系统,2013,34(7):1637-1640. 被引量：3
8李晓晔,孙振龙,邓佳宾,宋广军.隐私保护技术研究综述[J].计算机科学,2013,40(11A):199-202. 被引量：4
9侯令忠.基于差分隐私的体育个人信息安全保护及法律遵从研究[J].北京体育大学学报,2018,41(11):49-54. 被引量：8
10薛寿豪,张正道.基于箱聚类的差分隐私直方图发布方法研究[J].计算机应用研究,2014,31(12):3700-3703. 被引量：3

1陈燕,王禹封,谯木,赵正彩,苏宏华,朱夏林,冯天民.数字孪生在制造业中实现的关键技术及典型应用综述[J].航空制造技术,2024,67(11):24-45.
2叶志伟,王巧,周雯,王明威,蔡婷,何其祎.进化计算在大规模高维特征选择中的应用综述[J].北方工业大学学报,2024,36(2):8-19.
3李坤,王磊.BIM技术在安阳市建筑业转型中的应用综述[J].现代工程科技,2024,3(13):101-104.
4冯权江,龙文静,黄绍书.显微技术发展及其在生物科学中的应用综述[J].自然科学,2024,12(4):729-734.
5田钊,金鹏祥,牛亚杰,佘维,龙飞,刘炜.区块链在城市道路智能交通中的应用综述[J].郑州大学学报（理学版）,2024,56(6):9-16.
6刘凯文,金莹莹,王守巨.人工智能辅助的磁共振成像在评估乳腺癌新辅助化疗中的应用综述[J].数据采集与处理,2024,39(4):794-812.
7耿晋磊,高奇文,冯凯,袁康.汽车W-HUD前挡风玻璃的应用综述[J].建筑玻璃与工业玻璃,2024(7):15-17.
8洪舒宁,褚枫枫,池梦娇,丁力,郑毓萍,杨鸿吉,章佳楠,周涵璐,陶明.元认知在精神医学中的应用[J].浙江临床医学,2024,26(7):1094-1097.
9吴明阳,侯德新,吴石,洪佳威,李录彬.基于有限元仿真的钛合金喷丸技术应用综述[J].工具技术,2024,58(8):3-8.
10梁天宇,周桂鹏.三维扫描技术在房屋建筑结构检测与鉴定中的应用综述[J].广州建筑,2024,52(5):105-108.

农业大数据学报

2024年第2期

浏览历史

内容加载中请稍等...

面向高维数据发布的差分隐私算法及应用综述

参考文献14

二级参考文献132

共引文献233

相关作者

相关机构

相关主题

浏览历史