利用贝叶斯原理在隐私保护数据上进行分类的方法被引量：1

A Classification Method for Privacy-Preserved Data Using Bayesian Rule

下载PDF

导出

摘要针对可还原数据扰动(retrievable general additive data perturbation,RGADP)算法在保护数据库隐私时会影响数据挖掘结果的问题,提出一种利用贝叶斯原理在扰动数据上进行分类的方法。该方法分析RGADP算法过程,利用贝叶斯原理,根据扰动数据推算原始数据的概率分布,用估算的概率分布重构数据,并对重构数据进行分类以提高分类的正确性。实验结果表明:该方法估算出的概率分布与原始数据概率分布接近,且重构数据的分类正确率相比扰动数据而言平均可提高4%以上,其更接近原始数据的分类正确率,从而有效地降低了扰动算法对数据分类的影响;该方法的运行时间与数据量和数据分组数成正比,重构10 000条数据的运行时间在200ms以内,因此该方法也具有较高的效率。 A classification method for perturbed data using the Bayesian rule is presented to solve the problem that the result of data mining is affected when the retrievable general additive data perturbation（RGADP）algorithm is used to preserve privacy in database.The process of RGADP algorithm is analyzed,and the Bayesian rule is used to estimate the probability distribution of original data from the perturbed data.Then,new data are reconstructed from the estimated probability distribution and are classified to increase the accuracy of classification.Experimental results show that the probability distribution estimated by the proposed method is close to the original probability distribution.Comparison with the classification accuracy of perturbed data shows that the classification accuracy of the reconstructed data increases by more than 4% in average,and is closer to the original classification accuracy.Thus,the method can effectively reduce the effect of the perturbation algorithm on classification.Moreover,the running time of the method is proportional to the amount of data and the number of groups.The method costs less than 200 ms to reconstruct 10 thousands data,and has a high efficiency.

作者杨攀桂小林安健田丰王刚

机构地区西安交通大学电子与信息工程学院西安交通大学陕西省计算机网络重点实验室西安财经学院信息学院

出处《西安交通大学学报》 EI CAS CSCD 北大核心 2015年第4期46-52,共7页 Journal of Xi'an Jiaotong University

基金高等学校博士学科点专项科研基金资助项目(20120201110013) 国家自然科学基金资助项目(61172090 61472316) 中央高校基本科研业务费资助项目(XKJC2014008) 陕西省科技统筹创新工程资助项目(2013SZS16)

关键词隐私保护数据扰动贝叶斯原理分类 privacy-preservation data perturbation Bayesian rule classification

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献16

1周水庚,李丰,陶宇飞,肖小奎.面向数据库应用的隐私保护研究综述[J].计算机学报,2009,32(5):847-861. 被引量：221
2SWEENEY L. K-anonymity: a model for protecting privacy[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 2002, 10 (5) : 557-570.
3WANG S L, TSAI Z Z, TING I H, et al. Kanony- mous path privacy on social graphs [J]. Journal of In- telligent and Fuzzy Systems, 2014, 26 (3): 1191- 1199.
4LI Jin, WANG Qian, WANG Cong, et al. Fuzzy key- word search over encrypted data in cloud computing [C]//Proceedings of the 2010 IEEE International Con- ference on Computer Communications. Piscataway, NJ, USA: IEEE, 2010: 1-5.
5KANTARCIOGLU M, CLIFTON C. Privacy-preser- ving distributed mining of association rules on horizon- tally partitioned data [J]. IEEE Transactions on Knowledge and Data Engineering, 2004, 16(9): 1026- 1037.
6VAIDYA J, CLIFTON C. Privacy preserving k-means clustering over vertically partitioned data [ C] // Pro- ceedings of the 9th ACM SIGKDD International Con- ference on Knowledge Discovery and Data Mining. New York, USA: ACM, 2003: 206-215.
7张鹏,唐世渭.朴素贝叶斯分类中的隐私保护方法研究[J].计算机学报,2007,30(8):1267-1276. 被引量：19
8BAGHEL R, DUTTA M. Privacy preserving classifi- cation by using modified C4.5 [C] // Proceedings of the IEEE International Conference on Contemporary Com- puting. Piscataway, NJ, USA: IEEE, 2013: 124-129.
9MUIALIDHAI 1, PARSA R, 5AIAIHY R. A general additive data perturbation method for database security [J]. Management Science, 1999, 45 (10) : 1399-1415.
10MURALIDHAR K, SARATHY R. An enhanced data perturbation approach for small data sets [J]. Decision Sciences, 2005, 36(3): 513-529.

二级参考文献87

1罗永龙,黄刘生,荆巍巍,姚亦飞,陈国良.一个保护私有信息的布尔关联规则挖掘算法[J].电子学报,2005,33(5):900-903. 被引量：33
2葛伟平,汪卫,周皓峰,施伯乐.基于隐私保护的分类挖掘[J].计算机研究与发展,2006,43(1):39-45. 被引量：20
3杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
4张鹏,童云海,唐世渭,杨冬青,马秀莉.一种有效的隐私保护关联规则挖掘方法[J].软件学报,2006,17(8):1764-1774. 被引量：53
5张锋,常会友.基于分布式数据的隐私保持协同过滤推荐研究[J].计算机学报,2006,29(8):1487-1495. 被引量：17
6羌卫中,邹德清,金海.网格环境中证书和策略的隐私保护机制研究[J].计算机研究与发展,2007,44(1):11-19. 被引量：11
7Han J, Kamber M. Data Mining: Concepts and Techniques. 2nd Edition, San Francisco: Morgan Kaufmann Publishers, 2006
8Agrawal D, Aggarwal C C. On the design and auantification of privacy preserving data mining atgorithms//Proceedings of the Symposium on Principles of Database Systems (PODS). Santa Barbara, California, USA, 2001:247-255
9Verykios V S, Bertino E, Fovino I N, Provenza I N, Saygin Y, Theodoridis Y. State-of-the-art in privacy preserving data mining. ACM SIGMOD Record, 2004, 3(1): 50-57
10Agrawal R, Srikant R. Privacy preserving data mining//Proceedings of the ACM SIGMOD Conference on Management of Data (SIGMOD). Dallas, Texas, 2000:439-450

共引文献239

1鲁芳,仲伟俊,张玉林.基于数值转换的隐私保护线性回归方法[J].系统工程学报,2010,25(4):444-450.
2王一蕾,吴英杰,唐庆明.基于混合划分技术的隐私保护关系型数据发布算法[J].南京理工大学学报,2013,37(4):493-499. 被引量：2
3张勇,倪巍伟,崇志宏,胡新平.基于邻域相关性的面向聚类数据扰动方法[J].计算机研究与发展,2011,48(S3):79-85. 被引量：1
4杨震,范科峰,雷建军.隐私保护的自适应垃圾邮件过滤方法研究[J].通信学报,2009,30(S1):145-149. 被引量：2
5武毅,王丹,蒋宗礼.基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法[J].计算机研究与发展,2013,50(S1):248-256. 被引量：7
6万绪江,刘晓东,李洋.基于数据库管理安全的研究[J].气象与环境学报,2009,25(5):57-61. 被引量：6
7王平水,王建东.匿名化隐私保护技术研究进展[J].计算机应用研究,2010,27(6):2016-2019. 被引量：10
8兰丽辉,鞠时光,金华,刘善成.数据发布中的隐私保护研究综述[J].计算机应用研究,2010,27(8):2822-2827. 被引量：14
9申艳光,邵慧,张永强.隐私保护的分布式决策树分类算法的研究[J].计算机应用研究,2010,27(8):3070-3072. 被引量：4
10朱青,赵桐,王珊.面向查询服务的数据隐私保护算法[J].计算机学报,2010,33(8):1315-1323. 被引量：33

同被引文献4

1陈恒.中国居民金融资产结构变化对商业银行利润来源的影响[J].价值工程,2011,30(25):121-122. 被引量：1
2张珊.浅析我国商业银行的利润结构——以十六家上市银行为例[J].财经界,2015,0(24):19-21. 被引量：2
3何磊,任森春.上市银行盈利能力比较研究[J].牡丹江师范学院学报（社会科学版）,2016(3):15-18. 被引量：2
4苏雅玲,何幼桦.非参数回归的贝叶斯估计[J].上海大学学报（自然科学版）,2018,24(6):1022-1029. 被引量：1

引证文献1

1李帅鹏,侯为波.中国上市银行盈利水平的贝叶斯决策分析[J].哈尔滨师范大学自然科学学报,2019,35(4):17-24.

1李光,王亚东,苏小红.基于概率论的隐私保持分类挖掘[J].计算机工程,2012,38(3):12-13.
2付帅,姜奇,马建峰.一种无线传感器网络隐私保护数据聚合方案[J].计算机研究与发展,2016,53(9):2030-2038. 被引量：9
3YANG Pan GUI Xiaolin AN Jian YAO Jing LIN Jiancai TIAN Feng.A Retrievable Data Perturbation Method Used in Privacy-Preserving in Cloud Computing[J].China Communications,2014,11(8):73-84. 被引量：3
4李光,惠萌.改进的使用非负矩阵分解的隐私保护分类方法[J].计算机工程与应用,2015,51(21):1-5. 被引量：1
5徐尽.添加均匀分布噪声的数据扰动小样本分类算法[J].科技通报,2013,29(6):122-124. 被引量：1
6翁国庆,张森,倪巍伟.一种基于扰动的轨迹数据隐藏发布方法[J].东南大学学报（自然科学版）,2014,44(1):51-57. 被引量：3
7蔡春华,赵杰,宋丽.基于随机投影的隐私保护分布式聚类算法研究[J].牡丹江师范学院学报（自然科学版）,2014,40(3):1-3. 被引量：1
8季文韬,魏巍.基于奇异值分解的银行客户数据隐私保护算法研究[J].电子技术与软件工程,2017(4):228-229.
9吴雁.基于支持向量机的汽轮机参数辨识方法[J].机电产品开发与创新,2013,26(5):14-16.
10徐春,李广原.几种隐私数据挖掘算法研究进展[J].大众科技,2016,18(7):31-34. 被引量：2

西安交通大学学报

2015年第4期

浏览历史

内容加载中请稍等...

利用贝叶斯原理在隐私保护数据上进行分类的方法被引量：1

参考文献16

二级参考文献87

共引文献239

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

利用贝叶斯原理在隐私保护数据上进行分类的方法 被引量：1

参考文献16

二级参考文献87

共引文献239

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

利用贝叶斯原理在隐私保护数据上进行分类的方法被引量：1