图数据上的隐私攻击与防御技术被引量：8

State-of-the-Art Privacy Attacks and Defenses on Graphs

下载PDF

导出

摘要如今,图数据已经被广泛地应用于现实生活与科学研究当中,有巨大的使用和研究价值.但与此同时,针对图数据的收集与发布中也存在巨大的隐私风险.如何在保护图隐私的同时,发布与收集可用图数据,是目前个人、企业、政府等面临的重大挑战.本文首先从隐私信息所包含的内容、不同的隐私泄露场景,以及敌手模型三个方面深入地剖析了图数据在使用中存在的隐私风险,然后重点从攻击和防御两个角度展开介绍.针对攻击而言,本文分析了当前可行的图数据隐私攻击与攻击量化算法及其算法原理.针对防御而言,本文总结了简单匿名、图修改、聚类,以及差分隐私四种图数据隐私防御技术;分析了集中与分布两种数据存储场景下,不同类型图数据使用的各类隐私防御算法,以及数据隐私性与可用性度量方法.最后本文综合已有的研究成果,指出了图数据上隐私保护研究当前存在的问题、面临的挑战,及未来的研究方向. Graph,as a typical data type,can not only represent entities,but also relations and connections among entities.It has a preferable value for both use and study.Thus,the graph has been widely adopted in real-world applications and academic research,such as social networks,disease transmission networks,fraud detection et al.Though applied prevalently,the collection and publication of graphs are suffered from a strong privacy risk.Both the presence of a node or an edge and attributes on nodes and edges may be private information.The leakage of sensitive information can result in severe consequences for individuals,enterprises,and governments,which include but are not limited to life threats,reputation damages,and fall of market values.Therefore,it is imminent to study privacy-preserving methods for graph collection and publication.Directly applying the existing privacy-preserving techniques is insufficient for graph protection.First,strong data correlations put an obstacle.Adopting some of the privacypreserving techniques straightforwardly on graphs may severely destroy data utility by damaging data correlations.While the other techniques cannot provide a strong privacy guarantee as data correlations may increase the privacy risks.Second,it is hard to protect all private information at one time.Graphs often involve abundant sensitive information.Protecting all kinds of sensitive information with existing privacy-preserving techniques may bring too much perturbance to remain a high data utility.Striking a good balance on privacy and data utility for designing privacypreserving techniques on graphs is extremely challenging.Our survey makes a deep analysis of the privacy risks in the graph data collection and publication from three aspects:definition of private information,scenarios for privacy information leakage,the adversary models.Then,we conduct a comprehensive review on both privacy attacks and privacy defenses on graphs.The privacy attacks algorithms are roughly divided into types:seed-based attacks,seed-free attacks.By comparing these two types of attacks,we conclude that the seed-based attacks can achieve higher attacking accuracy by asking the adversaries equipped with strong background knowledge.On the contrary,seed-free attacks have a slightly lower attacking accuracy.Despite this,it is more practical,effective,and robust.In addition to attack algorithms,attack quantification methods are also presented in this work.For privacy defenses,we first introduce four types of privacypreserving techniques for graphs including naïve anonymization,graph modification,clustering,and differential privacy.Then,we review different defending algorithms in both centralized settings and decentralized settings.Specifically,different strategies have been proposed for four types of graphs including adjacent matrices,statistics,random graph parameters,and synthetic graphs in both types of settings.After investigating the algorithms for privacy attacking and defending,we further analyze the defensive effect of existing algorithms against different attacks.At last,challenges faced in privacy-preserving technique development that still need to be worked on are pointed out.Accordingly,we propose possible new techniques that can be adopted to graphs and introduce new scenarios where new privacy risks are emerging.In summary,though many efforts have been put in studying privacy-preserving schemes on graphs,a lot of progress still needs to be made in the future.

作者刘宇涵陈红刘艺璇赵丹李翠平 LIU Yu-Han;CEHN Hong;LIU Yi-Xuan;ZHAO Dan;LI Cui-Ping(Key Laboratory of Data Engineering and Knowledge Engineering of Education(Renmin University),Beijing 100872;School of Information,Renmin University,Beijing 100872)

机构地区数据工程与知识工程教育部重点实验室(中国人民大学) 中国人民大学信息学院

出处《计算机学报》 EI CAS CSCD 北大核心 2022年第4期702-734,共33页 Chinese Journal of Computers

基金国家重点研发计划(No.2018YFB1004401) 国家自然科学基金(No.62072460,62076245,61772537,61772536,62172424) 北京市自然科学基金(4212022) 中国人民大学科学研究基金(中央高校基本科研业务费专项资金)(21XNH179)资助.

关键词数据发布数据收集图数据隐私保护差分隐私 data publication data collection graphs privacy-preserving differential privacy

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1刘向宇,王斌,杨晓春.社会网络数据发布隐私保护技术综述[J].软件学报,2014,25(3):576-590. 被引量：76
2叶青青,孟小峰,朱敏杰,霍峥.本地化差分隐私研究综述[J].软件学报,2018,29(7):1981-2005. 被引量：73
3LI Yongkai,LIU Shubo,LI Dan,WANG Jun.Release Connection Fingerprints in Social Networks Using Personalized Differential Privacy[J].Chinese Journal of Electronics,2018,27(5):1104-1110. 被引量：6

二级参考文献3

1张啸剑,孟小峰.面向数据发布和分析的差分隐私保护[J].计算机学报,2014,37(4):927-949. 被引量：139
2孟小峰,张啸剑.大数据隐私管理[J].计算机研究与发展,2015,52(2):265-281. 被引量：93
3任奎.云计算中图像数据处理的隐私保护[J].网络与信息安全学报,2016,2(1):12-17. 被引量：5

共引文献149

1刘丹青,高瑜,吴振强.基于距离贡献率的隐私保护框架下k-medoids算法研究[J].青海师范大学学报（自然科学版）,2022,38(1):4-13.
2鲁川.基于差分隐私空间分解研究[J].信息通信,2019,0(11):17-19.
3孟小峰,王雷霞,刘俊旭.人工智能时代的数据隐私、垄断与公平[J].大数据,2020,6(1):35-46. 被引量：17
4孙慧中,杨健宇,程祥,苏森.一种基于随机投影的本地差分隐私高维数值型数据收集算法[J].大数据,2020,6(1):3-11. 被引量：4
5郑芳,魏建琴,李平珍.移动身份认证中的隐私保护方法的研究[J].网络安全技术与应用,2018(12):81-84. 被引量：2
6王胜和,孙福林.防止多社区结构化攻击的加权社会网络隐匿方法[J].安庆师范学院学报（自然科学版）,2016,22(2):39-42.
7曾羽琚.基于双曲方程特征分解的水生态数据挖掘[J].控制工程,2014,21(4):563-566. 被引量：1
8李长玲,郭凤娇,魏绪秋.基于时序关键词的学科交叉研究主题分析——以情报学与计算机科学为例[J].情报资料工作,2014,35(6):44-48. 被引量：22
9申艳光,闫晶星,买建英,范永健.基于敏感关系的社会网络隐私保护方法[J].计算机工程与设计,2015,36(2):355-362. 被引量：4
10李鹏伟,傅建明,李拴保,吕少卿,沙乐天.弹性移动云计算的研究进展与安全性分析[J].计算机研究与发展,2015,52(6):1362-1377. 被引量：12

同被引文献58

1张霁雯.社交媒体用户隐私关注、自我表露和隐私管理行为的实证研究[J].新媒体研究,2021(4):39-45. 被引量：3
2焦海涛.个人信息的反垄断法保护:从附属保护到独立保护[J].法学,2021(4):108-124. 被引量：102
3戢渼钧.关于个性化信息服务的隐私保护[J].图书情报工作,2006,50(2):49-51. 被引量：20
4侯海燕,刘则渊,陈悦,姜春林,尹丽春,庞杰.当代国际科学学研究热点演进趋势知识图谱[J].科研管理,2006,27(3):90-96. 被引量：158
5辛文娟,彭李余.社交网络环境下大学生隐私保护现状及对策研究——基于对重庆市六所高校的问卷调查[J].中国出版,2013(10):61-64. 被引量：6
6刘向宇,王斌,杨晓春.社会网络数据发布隐私保护技术综述[J].软件学报,2014,25(3):576-590. 被引量：76
7李凤华,李晖,贾焰,俞能海,翁健.隐私计算研究范畴及发展趋势[J].通信学报,2016,37(4):1-11. 被引量：81
8龚奇源,杨明,罗军舟.面向关系-事务数据的数据匿名方法[J].软件学报,2016,27(11):2828-2842. 被引量：4
9姜火文,曾国荪,马海英.面向表数据发布隐私保护的贪心聚类匿名方法[J].软件学报,2017,28(2):341-351. 被引量：26
10黄如花,李楠.美国开放政府数据中的个人隐私保护研究[J].图书馆,2017(6):19-24. 被引量：38

引证文献8

1田雷,赵东明,刘静,张杰,李承鹏.知识图谱的联邦学习知识融合算法研究[J].通讯世界,2022,29(11):196-198.
2孙涛,李晓会,李晗,赵雪.一种面向图数据的AWG-LDP局部差分隐私保护算法研究[J].计算机应用研究,2023,40(8):2467-2472.
3丁红发,唐明丽,刘海,蒋合领,傅培旺,于莹莹.邻居子图扰动下的k-度匿名隐私保护模型[J].西安电子科技大学学报,2023,50(4):180-193.
4张攀峰,吴丹华,董明刚.基于粒子群优化的差分隐私深度学习模型[J].计算机工程,2023,49(9):144-157. 被引量：1
5史伟,王园园,李刚,张兴.基于KFCMSA的(k,l)加权社交网络匿名算法[J].计算机应用研究,2023,40(10):3149-3154. 被引量：1
6丁红发,傅培旺,彭长根,龙士工,吴宁博.混洗差分隐私保护的度分布直方图发布算法[J].西安电子科技大学学报,2023,50(6):219-236. 被引量：1
7傅培旺,丁红发,刘海,蒋合领,唐明丽,于莹莹.基于本地差分隐私的分布式图统计采集算法[J].计算机研究与发展,2024,61(7):1643-1669. 被引量：1
8杨瑞仙,李航毅,孙倬.社交网络数据隐私保护:溯源、技术、政策、展望[J].农业图书情报学报,2024,36(4):4-20.

二级引证文献4

1张宇,蔡英,崔剑阳,张猛,范艳芳.卷积神经网络中基于差分隐私的动量梯度下降算法[J].计算机应用,2023,43(12):3647-3653. 被引量：1
2杨瑞仙,李航毅,孙倬.社交网络数据隐私保护:溯源、技术、政策、展望[J].农业图书情报学报,2024,36(4):4-20.
3朱友文,唐聪,吴启晖,张焱.个性化本地差分隐私机制的研究现状与展望[J].南京航空航天大学学报,2024,56(5):784-800.
4曹来成,陈丽.基于OLH和虚拟数据的SDP直方图发布算法[J].计算机应用研究,2024,41(12):3829-3833.

1李传煌,唐晶晶,陈泱婷,雷睿,陈超,王伟明.基于拟态防御架构的服务功能链执行体动态调度方法[J].电信科学,2022,38(4):101-112. 被引量：4
2蔡伟光.夯实碳排放数据基础,推动建筑碳达峰碳中和战略[J].建设科技,2022(6):6-8. 被引量：1
3薛薇.跨境电商运营分析和改进策略——以某企业实践为例[J].销售与管理,2020(33):22-23.
4杨永晟,李岩,鲁婷婷,冯宇婷,董华铮,赵震.Zr基金属有机框架材料光催化分解水的研究进展[J].沈阳师范大学学报（自然科学版）,2022,40(1):10-16.
5资讯[J].普洱,2022(3):20-25.
6王江晴,冀星,莫海芳,帖军,刘畅.基于轻量化VGG的植物病虫害识别[J].中国农机化学报,2022,43(4):25-31. 被引量：17
7郑彦军.初中信息技术教学中应用翻转课堂的教学效果研究[J].电脑迷·教师研修,2022(4):59-60.
8张宇峰.基于绿色建筑设计在高层民用建筑设计的应用探析[J].城市建设理论研究（电子版）,2021,11(31):60-62. 被引量：2
9石聪聪,高先周,黄秀丽,毛云龙.联邦学习隐私模型发布综述[J].南京信息工程大学学报（自然科学版）,2022,14(2):127-136. 被引量：6
10施启军,潘峰,龙福海,李娜娜,苟辉朋,苏浩辀,谢雨寒.特征选择方法研究综述[J].微电子学与计算机,2022,39(3):1-8. 被引量：31

计算机学报

2022年第4期

浏览历史

内容加载中请稍等...

图数据上的隐私攻击与防御技术被引量：8

参考文献3

二级参考文献3

共引文献149

同被引文献58

引证文献8

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

图数据上的隐私攻击与防御技术 被引量：8

参考文献3

二级参考文献3

共引文献149

同被引文献58

引证文献8

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

图数据上的隐私攻击与防御技术被引量：8