基于动态分类树构造的集值型数据差分隐私保护方法被引量：1

Constructing taxonomy tree based dynamic method for differential privacy preserving set-valued data

下载PDF

导出

摘要基于分类树划分的差分隐私方法能有效地对集值型数据的发布进行保护,但在构造分类树时该方法没有充分利用集值型数据集自身的特征。通过对添加噪声量的影响因素分析,提出了一种基于数据集特征的集值型数据发布方法,该方法首先对数据集进行分析,然后根据数据集中记录的种类数占总输出域的比例以及只出现一次的记录种类数占总输出域比例,动态构造分类树。实验结果表明:当数据集满足IOR≤40%且SIOR=(5%,20%]时,通过有效利用集值型数据集的特征,构造较优的分类树,可以添加少于10%的噪声。 Taxonomy tree partitioning based method for differential privacy could protect the effective releasing of set-valued data. However, taxonomy tree does not take the characteristics of set-valued datasets into consideration of tree construction. By analyzing the influence factors of added noise, this paper proposed a novel method that releases set-valued data based on the characteristics of datasets. This method firstly analyzed the datasets, and then dynamically formed taxonomy tree structure according to the types of records in the dataset and the proportion between the total output of a single record field and the total number of species appeared in proportional output fields. The experimental results show that the proposed method can effectively utilize the characteristics of set-valued datasets, when the datasets conditions satisfy IOR ≤40% and SIOR = （5% ,20% ], constructing superior taxonomy tree and reducing noise to less than 10%.

作者郑剑黄奚芳刘聪

机构地区江西理工大学信息工程学院

出处《计算机应用研究》 CSCD 北大核心 2015年第8期2420-2424,2436,共6页 Application Research of Computers

基金江西省教育厅科学技术研究项目(GJJ13415) 江西理工大学科研基金重点课题(NSFJ2014-K11)

关键词分类树差分隐私保护集值型数据数据集特征 taxonomy tree differential privacy set-valued data datasets characteristics

分类号 TP309.7 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献16

1张啸剑,王淼,孟小峰.差分隐私保护下一种精确挖掘top-k频繁模式方法[J].计算机研究与发展,2014,51(1):104-114. 被引量：29
2熊平,朱天清,王晓峰.差分隐私保护及其应用[J].计算机学报,2014,37(1):101-122. 被引量：176
3康海燕,XIONG Li.面向大数据的个性化检索中用户匿名化方法[J].西安电子科技大学学报,2014,41(5):148-154. 被引量：9
4张啸剑,孟小峰.面向数据发布和分析的差分隐私保护[J].计算机学报,2014,37(4):927-949. 被引量：139
5熊平,朱天清,金大卫.一种面向决策树构建的差分隐私保护算法[J].计算机应用研究,2014,31(10):3108-3112. 被引量：12
6Dwork C. Differential privacy[M] //Automata, Languages and Programming. Berlin Heidelberg:Springer, 2006:1-12.
7Terrovitis M, Mamoulis N, Kalnis P. Privacy-preserving anonymization of set-valued data[J] . Proceedings of the VLDB Endowment, 2008, 1(1):115-125.
8Chen R, Acs G, Castelluccia C. Differentially private sequential data publication via variable-length n-grams[C] //Proc of ACM Conference on Computer and Communications Security. New York:ACM Press, 2012:638-649.
9Chen Rui, Fung B C M, Desai B C, et al. Differentially private transit data publication:a case study on the montreal transpor tation system[C] //Proc of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York:ACM Press, 2012.
10Cormode G, Procopiuc M, Shen Entong, et al. Differentially private spatial decompositions[C] //Proc of the 28th IEEE International Conference on Data Engineering. [S. l.] :IEEE Press, 2012.

二级参考文献43

1Agrawal R, Srikant R. Fast algorithms for mining association rules in large databases [C]//Proc of the 20th Int Conf on Very Large Data Bases (VLDB'94). New York: ACM, 1994: 487-499.
2Sweeney L. k-anonymity: A model for protecting privacy [J]. International Journal on Uncertainty, Fuzziness and Knowledge-based Systems, 2002, 10(5): 557-570.
3Atzori M, Bonchi F, Giannotti F, et al. Anonymity preserving pattern discovery [J]. The VLDB Journal, 2008, 17(4) : 703-727.
4Ganta S R, Kasiviswanathan S P, Smith A. Composition attacks and auxiliary information in data privacy [C]//Proc of the 14th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining (KDD08). New York: ACM, 2008: 265- 273.
5WongR C W, Fu A, Wang K, et al. Can the utility of anonymi:ed data be used for privacy breaches[J]. ACM Trans on Knowledge Discovery from Data, 2011, 5(3) : 16- 39.
6Dwork C. Differential privacy [C] //Proc of the 33th Colloquium on Automata, Languages and Programming (ICALP06). Berlin: Springer, 2006:1-12.
7Dwork C. Differential privacy: A survey of results [C] // Proc of the 5th Int Conf on Theory and Applications of Models of Computation (TAMC08). Berlin: Springer, 2008: 1-19.
8Dwork C, Lei J. Differential privacy and robust statistics [C] //Proc of the 41st Annual ACM Syrup on Theory of Computing (STOC09). New York: ACM, 2009:371-380.
9Dwork C. The differential privacy frontier (extended abstract)[C] //Proe of the 6th Theory of Cryptography Conf (TCC09). Berlin: Springer, 2009:496-502.
10Bhaskar R, Laxman S, Smith A, et al. Discovering frequent patterns in sensitive data [C] //Proc of the 16th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining (KDD10). New York: ACM, 2010:503-512.

共引文献282

1李坪.大数据赋权正当性证成[J].中山大学法律评论,2020(1):3-21. 被引量：1
2张小玉,沈国华,杨阳.基于属性分割的差分隐私异构多属性数据发布[J].计算机系统应用,2022,31(10):225-235.
3李昱.“去识别化的个人信息”不受刑法保护吗?[J].刑事法评论,2019(1):656-692. 被引量：2
4孟小峰,王雷霞,刘俊旭.人工智能时代的数据隐私、垄断与公平[J].大数据,2020,6(1):35-46. 被引量：17
5侯令忠.基于差分隐私的体育个人信息安全保护及法律遵从研究[J].北京体育大学学报,2018,41(11):49-54. 被引量：9
6丁丽萍,卢国庆.面向频繁模式挖掘的差分隐私保护研究综述[J].通信学报,2014,35(10):200-209. 被引量：19
7陈旋,刘健,冯新淇,赵雪美.基于朴素贝叶斯的差分隐私合成数据集发布算法[J].计算机科学,2015,42(1):236-238. 被引量：11
8王超,杨静,张健沛.基于轨迹特征及动态邻近性的轨迹匿名方法研究[J].自动化学报,2015,41(2):330-341. 被引量：8
9顾铖,朱保平,张金康.一种改进的隐私保护关联规则挖掘算法[J].南京航空航天大学学报,2015,47(1):119-124. 被引量：3
10XU Jian,YANG Geng,CHEN Zhengyu,WANG Qianqian.A Survey on the Privacy-Preserving Data Aggregation in Wireless Sensor Networks[J].China Communications,2015,12(5):162-180. 被引量：4

同被引文献7

1熊平,朱天清,王晓峰.差分隐私保护及其应用[J].计算机学报,2014,37(1):101-122. 被引量：176
2张啸剑,孟小峰.面向数据发布和分析的差分隐私保护[J].计算机学报,2014,37(4):927-949. 被引量：139
3丁丽萍,卢国庆.面向频繁模式挖掘的差分隐私保护研究综述[J].通信学报,2014,35(10):200-209. 被引量：19
4林少聪,叶阿勇,许力.基于坐标变换的k匿名位置隐私保护方法[J].小型微型计算机系统,2016,37(1):119-123. 被引量：9
5戚名钰,黄刘生,陆潇榕,杨威.采用成分分析的差分隐私数据发布算法[J].小型微型计算机系统,2017,38(3):437-443. 被引量：4
6杨月平,王箭.基于k-匿名的多源数据融合算法研究[J].计算机技术与发展,2017,27(5):102-107. 被引量：4
7苏炜航,程祥.一种基于隐树模型的满足差分隐私的高维数据发布算法[J].小型微型计算机系统,2018,39(4):681-685. 被引量：4

引证文献1

1李万杰,张兴,曹光辉,李帅,张青云.基于差分隐私保护的数据分级融合发布机制[J].小型微型计算机系统,2019,40(10):2252-2256. 被引量：9

二级引证文献9

1李杨,陈子彬,谢光强.一种基于ExtraTrees的差分隐私保护算法[J].计算机工程,2020,46(2):134-140. 被引量：6
2李远航,陈先来,刘莉,安莹,李忠民.面向差分隐私保护的随机森林算法[J].计算机工程,2020,46(1):93-101. 被引量：8
3田华,何翼.基于二分关联图的大数据隐私保护方法[J].重庆邮电大学学报（自然科学版）,2020,32(4):673-680. 被引量：5
4方晨,郭渊博,王娜,甄帅辉,唐国栋.基于生成对抗网络的差分隐私数据发布方法[J].电子学报,2020,48(10):1983-1992. 被引量：10
5李晓会,陈潮阳,白雨靓,张兴.一种轨迹隐私保护服务推荐模型研究[J].小型微型计算机系统,2021,42(5):990-995. 被引量：3
6范絮妍,吴小倩,冯立胜,王欣.电子政务数据安全态势感知平台建设实践探索[J].信息安全研究,2021,7(10):954-961. 被引量：5
7刘东,任海玲.基于差分隐私的大数据安全访问权限认证仿真[J].计算机仿真,2021,38(8):421-424. 被引量：16
8王辉,廉芳芳,申自浩.结合四叉树划分的差分隐私位置发布算法[J].小型微型计算机系统,2021,42(11):2394-2399. 被引量：2
9荣剑.基于差分隐私保护的电子病历数据安全风险监测系统[J].自动化技术与应用,2022,41(12):169-172. 被引量：5

1马银方,张琳.基于差分隐私保护的KDCK-medoids动态聚类算法[J].计算机科学,2016,43(S2):368-372. 被引量：8
2王宝楠,方贤进.基于差分隐私的线性回归分析[J].电脑知识与技术,2016,12(2X):26-29.
3王彤,黄树斌.差分隐私保护下一种改进的协同过滤推荐算法[J].信息安全与技术,2016,7(4):26-28.
4刘文龙,方贤进.差分隐私合成数据集发布研究[J].电子世界,2016,0(5):80-81.
5李杨,温雯,谢光强.差分隐私保护研究综述[J].计算机应用研究,2012,29(9):3201-3205. 被引量：40
6刘娟,朱翔鸥,刘文斌.基于交互信息的数据集特征结构研究[J].模式识别与人工智能,2014,27(1):82-88. 被引量：1
7李洪奇,徐青松,朱丽萍,戚雪晨.基于数据集相似性的分类算法推荐[J].计算机应用与软件,2016,33(8):62-66. 被引量：6
8曾子林,张宏军,张睿,王之腾.基于元学习思想的算法选择问题综述[J].控制与决策,2014,29(6):961-968. 被引量：14
9梁竹.支持数据挖掘算法选择的数据集特征提取研究[J].数字技术与应用,2011,29(4):117-120. 被引量：1
10康海燕,马跃雷.差分隐私保护在数据挖掘中应用综述[J].山东大学学报（理学版）,2017,52(3):16-23. 被引量：15

计算机应用研究

2015年第8期

浏览历史

内容加载中请稍等...

基于动态分类树构造的集值型数据差分隐私保护方法被引量：1

参考文献16

二级参考文献43

共引文献282

同被引文献7

引证文献1

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于动态分类树构造的集值型数据差分隐私保护方法 被引量：1

参考文献16

二级参考文献43

共引文献282

同被引文献7

引证文献1

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于动态分类树构造的集值型数据差分隐私保护方法被引量：1