基于差分隐私的贝叶斯网络隐私保护算法的改进研究被引量：7

Research on Improvement of Bayesian Network Privacy Protection Algorithm Based on Differential Privacy

下载PDF

导出

摘要针对数据企业对用户信息以及开放数据趋势下政府数据发布工作对脱敏保护算法的迫切需求,文章提出一种基于差分隐私保护理论的具有属性段首选机制和基于聚类算法的贝叶斯网络改进型算法FCPrivBayes。该算法避免了对首个属性段属性的随机化选择,并用聚类的方法取代等宽法对数据进行离散化处理。实验数据表明,在保障数据隐私的前提下,FCPrivBayes有效提升了数据的可用性指标,为企业保护数据、政府发布数据提供了新的技术方案,有利于用户隐私保护工作的推进和大数据产业的发展。 In response to the urgent need for desensitization protection algorithms by the data companies and open government publishing data,under the strict differential privacy theory,an improved Bayesian network algorithm FCPrivBayes with an attribute segment preference mechanism and a clustering algorithm is proposed,which avoids the random selection of the attributes of the first attribute segment,and uses the clustering method to replace the equal-width method to discretize the data.Experimental data show that FCPrivBayes effectively improves data utility indicators while ensuring the data privacy protection effect.Which provides new technical options for data companies to protect data and for government to release data,and benefits the user privacy protection and the development of the big data industry.

作者肖彪闫宏强罗海宁李炬成 XIAO Biao;YAN Hongqiang;LUO Haining;LI Jucheng(Beijing Jiaotong University,Beijing 100044,China;Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190,China;University of Chinese Academy of Sciences,Beijing 100049,China;National Information Center,Beijing 100045,China;School of Transportation Engineering,Dalian Maritime University,Dalian 116000,China)

机构地区北京交通大学中国科学院计算机网络信息中心中国科学院大学国家信息中心大连海事大学交通运输工程学院

出处《信息网络安全》 CSCD 北大核心 2020年第11期75-86,共12页 Netinfo Security

基金国家重点研发计划[2017YFB0801902,2018YFB2101501]。

关键词差分隐私贝叶斯网络算法隐私保护 differential privacy theory Bayesian network algorithm privacy protection

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1张啸剑,孟小峰.面向数据发布和分析的差分隐私保护[J].计算机学报,2014,37(4):927-949. 被引量：138
2郝志峰,王日宇,蔡瑞初,温雯.基于贝叶斯网络与语义树的隐私数据发布方法[J].计算机工程,2019,45(4):124-129. 被引量：9
3欧阳佳,印鉴,刘少鹏.一种分布式事务数据的差分隐私发布策略[J].软件学报,2015,26(6):1457-1472. 被引量：7
4王良,王伟平,孟丹.基于加权贝叶斯网络的隐私数据发布方法[J].计算机研究与发展,2016,53(10):2343-2353. 被引量：15
5张琳,刘彦,王汝传.位置大数据服务中基于差分隐私的数据发布技术[J].通信学报,2016,37(9):46-54. 被引量：21
6张啸剑,陈莉,金凯忠,孟小峰.基于联合树的隐私高维数据发布方法[J].计算机研究与发展,2018,55(12):2794-2809. 被引量：10

二级参考文献64

1Savasere A, Omieeinski ER, Navathe SB. An efficient algorithm for mining association rules in large databases. In: Proc. of the 21th Int'l Conf. on Very Large Data Bases (VLDB). San Francisco: Morgan Kaufmann Publishers, 1995. 432-444.
2Agrawal R, Srikant R. Fast algorithms for mining association rules. In: Proc. of the 20th Int'l Conf. on Very Large Data Bases (VLDB). San Mateo: Morgan Kaufmann Publishers, 1994. 487-499.
3Adar E, Weld DS, Bershad BN, Gribble SD. Why we search: Visualizing and predicting user behavior. In: Proc. of the 16th Int'l Conf. on World Wide Web. Banff: ACM Press, 2007. 161-170. [doi: 10.1145/1242572.1242595].
4Sweeney L. K-Anonymity: A model for protecting privacy. Int'l Journal of Uncertainty Fuzziness and Knowledge Based Systems, 2002,10(5):557-570. [doi: 10.1142/S0218488502001648].
5Machanavajjhala A, Gehrke J, Kifer D, Venkitasubramaniam M. L-Diversity: Privacy beyond k-anonymity. ACM Trans. on Knowledge Discovery from Data (TKDD), 2007,1 (1):3. Idol: 10.1145/1217299.1217302].
6Fung BCM, Wang K, Chen R, Yu PS. Privacy preserving data publishing: A survey of recent developments. ACM Computing Surveys, 2010,42(4): 1-53. [doi: 10.1145/1749603.1749605].
7Hong Y, Vaidya J, Lu HB, Wu MR. Differentially private search log sanitization with optimal output utility. In: Proc. of the 15th Int'l Conf. on Extending Database Technology. Berlin: ACM Press, 2012.50-61. [doi: 10.1145/2247596.2247604].
8He Y, Naughton .IF. Anonymization of set-valued data via top-down, local generalization. Proc. of the VLDB Endowment, 2009, 2(1):934-945. Idol: 10.14778/1687627.1687733].
9Xu YB, Wang K, Fu AWC, Yu PS. Anonymizing transaction databases for publication. In: Proc. of the ACM SIGKDD Int'l Conf. on Knowledge Discovery and Data Mining (KDD). New York: ACM Press, 2008. 767-775. Idol: 10.1145/1401890.1401982].
10Ghinita G, Kalnis P, Tao YF. Anonymous publication of sensitive transactional data. IEEE Trans. on Knowledge and Data Engineering, 2011,23(2): 161-174. [doi: 10.1109/TKDE.2010.101 ].

共引文献176

1张小玉,沈国华,杨阳.基于属性分割的差分隐私异构多属性数据发布[J].计算机系统应用,2022,31(10):225-235.
2李昱.“去识别化的个人信息”不受刑法保护吗?[J].刑事法评论,2019(1):656-692. 被引量：1
3孟小峰,王雷霞,刘俊旭.人工智能时代的数据隐私、垄断与公平[J].大数据,2020,6(1):35-46. 被引量：16
4方德庆,梁定益.北羌塘盆地中部上侏罗统研究新进展[J].地层学杂志,2000,24(2):163-167. 被引量：11
5康海燕,朱万祥.位置服务隐私保护[J].山东大学学报（理学版）,2018,53(11):35-50. 被引量：6
6丁丽萍,卢国庆.面向频繁模式挖掘的差分隐私保护研究综述[J].通信学报,2014,35(10):200-209. 被引量：19
7王超,杨静,张健沛.基于轨迹特征及动态邻近性的轨迹匿名方法研究[J].自动化学报,2015,41(2):330-341. 被引量：7
8郑剑,黄奚芳,刘聪.基于动态分类树构造的集值型数据差分隐私保护方法[J].计算机应用研究,2015,32(8):2420-2424. 被引量：1
9王俊丽,管敏,魏绍臣.面向社交网络分析的差分隐私保护研究综述[J].高技术通讯,2015,25(3):239-248. 被引量：5
10兰丽辉,鞠时光.基于差分隐私的权重社会网络隐私保护[J].通信学报,2015,36(9):145-159. 被引量：25

同被引文献46

1孙慧中,杨健宇,程祥,苏森.一种基于随机投影的本地差分隐私高维数值型数据收集算法[J].大数据,2020,6(1):3-11. 被引量：4
2胡洁.高维数据特征降维研究综述[J].计算机应用研究,2008,25(9):2601-2606. 被引量：65
3马忠红.手机信息的侦查方法研究[J].新疆警官高等专科学校学报,2009,29(2):3-8. 被引量：11
4王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J].计算机学报,2009,32(7):1229-1246. 被引量：369
5吴晓婷,闫德勤.数据降维方法分析与研究[J].计算机应用研究,2009,26(8):2832-2835. 被引量：73
6杨高明,杨静,张健沛.聚类的(α,k)-匿名数据发布[J].电子学报,2011,39(8):1941-1946. 被引量：19
7姚旭,王晓丹,张玉玺,权文.特征选择方法综述[J].控制与决策,2012,27(2):161-166. 被引量：206
8裘国永,张娇.基于二分K-均值的SVM决策树自适应分类方法[J].计算机应用研究,2012,29(10):3685-3687. 被引量：8
9慕春棣,tsinghua.edu.cn,戴剑彬,叶俊.用于数据挖掘的贝叶斯网络[J].软件学报,2000,11(5):660-666. 被引量：100
10杨静,赵家石,张健沛.一种面向高维数据挖掘的隐私保护方法[J].电子学报,2013,41(11):2187-2192. 被引量：20

引证文献7

1张兴,陈昊.差分隐私的高维数据发布研究综述[J].智能系统学报,2021,16(6):989-998. 被引量：4
2刘峰,杨成意,於欣澄,齐佳音.面向去中心化双重差分隐私的谱图卷积神经网络[J].信息网络安全,2022(2):39-46. 被引量：3
3张照星,胡珵璇,范英,闫继培.电信诈骗案件中基于运营商国际漫游话单的嫌疑号码拓展[J].信息网络安全,2021(S01):12-16. 被引量：1
4晏燕,张雄,冯涛.大数据统计划分发布的等比差分隐私预算分配方法[J].信息网络安全,2022(11):24-35. 被引量：1
5赵佳,高塔,张建成.基于改进贝叶斯网络的高维数据本地差分隐私方法[J].信息网络安全,2023(2):19-25. 被引量：1
6石雪松,殷丽凤.基于贝叶斯网络的隐私数据研究[J].信息技术与信息化,2023(9):119-122.
7卢晓天,朴春慧,杨兴雨,白英杰.基于贝叶斯网络的差分隐私高维数据发布技术研究[J].计算机工程,2024,50(5):167-181.

二级引证文献10

1田雅轩,王迎利.区块链技术在药品品种档案管理系统中的应用探索与实践[J].中国医药导刊,2022,24(10):1009-1015. 被引量：2
2陈哲,王坤,刘彦伯.5G-CRAN无线优化运维研究与实践[J].中国宽带,2022,18(12):29-31.
3Chengqi Liu,Haijian Ye,Longhe Wang,Shuhan Lu,Lin Li.Novel tracking method for the drinking behavior trajectory of pigs[J].International Journal of Agricultural and Biological Engineering,2023,16(6):67-76.
4尹春勇,蒋奕阳.基于个性化时空聚类的差分隐私轨迹保护模型[J].信息网络安全,2024(1):80-92.
5傅彦铭,陆盛林,陈嘉元,覃华.基于深度强化学习和隐私保护的群智感知动态任务分配策略[J].信息网络安全,2024(3):449-461.
6褚治广,李俊燕,陈昊,张兴.基于分布式多关联属性的高维数据差分隐私保护方法[J].计算机工程与设计,2024,45(4):967-973.
7罗康,刘帮富,李嘉.面向数据挖掘应用的改进BACO高维数据降维模型设计[J].自动化与仪器仪表,2024(4):82-86.
8程思源,龙士工.基于联合树的高维数据本地化差分隐私保护算法[J].计算机工程与设计,2024,45(6):1601-1606.
9李界雯,陈佳佳,李师毅.自适应隐私预算分配的差分隐私梯度下降算法[J].数学的实践与认识,2024,54(7):129-140.
10龙春,秦泽秀,李丽莎,李婧,杨帆,魏金侠,付豫豪.面向高维数据发布的差分隐私算法及应用综述[J].农业大数据学报,2024,6(2):170-184.

1龙萍,邢镔,胡小林,朱林全.基于区块链的物流价值链数据安全共享技术[J].信息技术与网络安全,2020,39(12):13-18. 被引量：3
2曹松伟,蒋海峰,陈璐璐.一种基于分布式电源系统的配网自适应保护算法[J].机电信息,2020(35):18-19. 被引量：1
3《临床神经外科杂志》编辑部.《临床神经外科杂志》入选中国高质量科技期刊分级目录[J].临床神经外科杂志,2020,17(6):651-651.
4《工程爆破》入选有色金属领域高质量科技期刊分级目录[J].工程爆破,2020,26(6):114-114.
5杨达森.DPLORE:一种差分隐私保护位置推荐算法[J].广东工业大学学报,2021,38(1):69-74. 被引量：1
6滕红.公路边坡状态自动化监测与经济性分析[J].西部交通科技,2020(8):38-42. 被引量：1
7刘洪涛,严世榕,张甫圆.纯电动汽车永磁同步电机驱动控制[J].福州大学学报（自然科学版）,2020,48(6):741-746. 被引量：6
8严道南.谈一谈脱敏治疗[J].江苏卫生保健,2020,8(12):13-13.
9卢扬逊.数据财产权益的私法保护[J].甘肃社会科学,2020(6):132-138. 被引量：21
10赵子涵,穆希辉,杜峰坡.橡胶履带柔性复合材料的本构模型[J].兵工学报,2020,41(9):1719-1726. 被引量：3

信息网络安全

2020年第11期

浏览历史

内容加载中请稍等...

基于差分隐私的贝叶斯网络隐私保护算法的改进研究被引量：7

参考文献6

二级参考文献64

共引文献176

同被引文献46

引证文献7

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于差分隐私的贝叶斯网络隐私保护算法的改进研究 被引量：7

参考文献6

二级参考文献64

共引文献176

同被引文献46

引证文献7

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于差分隐私的贝叶斯网络隐私保护算法的改进研究被引量：7