Parzen窗核密度估计的大规模数据模式分类隐私保护方法被引量：1

A Pattern Classification Privacy Preservation Algorithm Based on Parzen Window Kernel Density Estimation for Large Data Set

原文传递

导出

摘要针对大规模数据集上的模式分类任务,提出基于Parzen窗核密度估计的模式分类隐私保护算法。利用Parzen窗算法对原始大规模训练集服从的概率密度进行估计,根据估计的概率密度函数构造la个替换训练样本,其中l为原始样本的数目,a通过10折交叉验证方式确定。最后发布替换训练样本进行模式分类,以实现原始数据上的隐私保护。在Adult数据集上的仿真实验充分验证了算法的有效性。 In this paper, a pattern classification privacy preservation algorithm is proposed based on the Parzen window kernel density estimation on large scale dataset. Firstly, the probability density is estimated through the original large scale training set. Then the replacement training samples are constructed by the estimated probability. Finally, the replacement training samples are published for the pattern classification training. Thus the privacy on the original training set can be protected effectively. The simulation experiments on Adult datasets fully verify the effectiveness of the proposed algorithm.

作者原永滨杨静张健沛于旭

机构地区哈尔滨工程大学计算机科学与技术学院福州大学电气工程与自动化学院青岛科技大学信息科学与技术学院

出处《科技导报》 CAS CSCD 北大核心 2014年第36期104-109,共6页 Science & Technology Review

基金国家自然科学基金项目(61073041 61073043 61370083 61402126) 黑龙江省自然科学基金项目(F200901) 福建省自然科学基金项目(2011J1296) 高等学校博士学科点基金项目(20112304110011 20112304110012)

关键词 PARZEN窗核密度估计数据发布隐私保护 Parzen window kernel density estimation data publish privacy preserving

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献11

1Han J W, Kamber M. Data mining: Concepts and techniques[M]. San Francisco, CA: Morgan Kaufmann, 2001: 257-259.
2周水庚,李丰,陶宇飞,肖小奎.面向数据库应用的隐私保护研究综述[J].计算机学报,2009,32(5):847-861. 被引量：219
3周恩策,刘纯平,张玲燕,龚声蓉,刘全.基于时间窗的自适应核密度估计运动检测方法[J].通信学报,2011,32(3):106-114. 被引量：14
4Yang J, Yu X, Xie Z Q. A novel virtual sample generation method based on Gaussian distribution[J]. Knowledge-Based Systems, 2011, 24 (6): 740-748.
5Cortes C, Vapnik V. Support vector networks[J]. Machine Learning, 1995, 20(8): 273-297.
6Quinlan J R. C4.5: Programs for Machine Learning[M]. San Mateo, CA: Morgan Kaufmann, 1993, 17-69.
7Xiao X, Tao Y. Personalized privacy preservation[C]//Proceedings of the 2006 ACM SIGMOD International Conference on Management of Data. Illinois, Chicago: ACM, 2006: 229-240.
8Sweeney L. K-anonymity: A model for protecting privacy[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 2002, 10(5): 557-570.
9Machanavajjhala A, Kifer D, Gehrke J, et al. L-diversity: Privacy beyond K-anonymity[J]. ACM Transactions on Knowledge Discovery from Data, 2007(1): 3-15.
10Agrawal R, Srikant R. Privacy-preserving data mining[J]. ACM Sigmod Record, 2000, 29(2): 439-450.

二级参考文献84

1罗永龙,黄刘生,荆巍巍,姚亦飞,陈国良.一个保护私有信息的布尔关联规则挖掘算法[J].电子学报,2005,33(5):900-903. 被引量：33
2葛伟平,汪卫,周皓峰,施伯乐.基于隐私保护的分类挖掘[J].计算机研究与发展,2006,43(1):39-45. 被引量：20
3杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
4张鹏,童云海,唐世渭,杨冬青,马秀莉.一种有效的隐私保护关联规则挖掘方法[J].软件学报,2006,17(8):1764-1774. 被引量：53
5张锋,常会友.基于分布式数据的隐私保持协同过滤推荐研究[J].计算机学报,2006,29(8):1487-1495. 被引量：17
6羌卫中,邹德清,金海.网格环境中证书和策略的隐私保护机制研究[J].计算机研究与发展,2007,44(1):11-19. 被引量：11
7Han J, Kamber M. Data Mining: Concepts and Techniques. 2nd Edition, San Francisco: Morgan Kaufmann Publishers, 2006
8Agrawal D, Aggarwal C C. On the design and auantification of privacy preserving data mining atgorithms//Proceedings of the Symposium on Principles of Database Systems (PODS). Santa Barbara, California, USA, 2001:247-255
9Verykios V S, Bertino E, Fovino I N, Provenza I N, Saygin Y, Theodoridis Y. State-of-the-art in privacy preserving data mining. ACM SIGMOD Record, 2004, 3(1): 50-57
10Agrawal R, Srikant R. Privacy preserving data mining//Proceedings of the ACM SIGMOD Conference on Management of Data (SIGMOD). Dallas, Texas, 2000:439-450

共引文献230

1王一蕾,吴英杰,唐庆明.基于混合划分技术的隐私保护关系型数据发布算法[J].南京理工大学学报,2013,37(4):493-499. 被引量：2
2张勇,倪巍伟,崇志宏,胡新平.基于邻域相关性的面向聚类数据扰动方法[J].计算机研究与发展,2011,48(S3):79-85. 被引量：1
3武毅,王丹,蒋宗礼.基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法[J].计算机研究与发展,2013,50(S1):248-256. 被引量：7
4万绪江,刘晓东,李洋.基于数据库管理安全的研究[J].气象与环境学报,2009,25(5):57-61. 被引量：6
5王平水,王建东.匿名化隐私保护技术研究进展[J].计算机应用研究,2010,27(6):2016-2019. 被引量：10
6兰丽辉,鞠时光,金华,刘善成.数据发布中的隐私保护研究综述[J].计算机应用研究,2010,27(8):2822-2827. 被引量：14
7申艳光,邵慧,张永强.隐私保护的分布式决策树分类算法的研究[J].计算机应用研究,2010,27(8):3070-3072. 被引量：4
8朱青,赵桐,王珊.面向查询服务的数据隐私保护算法[J].计算机学报,2010,33(8):1315-1323. 被引量：33
9刘腾腾,倪巍伟,崇志宏,张勇.多维数值敏感属性隐私保护数据发布方法[J].东南大学学报（自然科学版）,2010,40(4):699-703. 被引量：6
10陈娟,方滨兴,殷丽华,苏申.传感器网络中基于源节点有限洪泛的源位置隐私保护协议[J].计算机学报,2010,33(9):1736-1747. 被引量：53

同被引文献10

1徐美凤,叶继元.学术虚拟社区知识共享主体特征分析[J].图书情报工作,2010,54(22):111-114. 被引量：36
2白俊红,江可申,李婧.中国地区研发创新的技术效率与技术进步[J].科研管理,2010,31(6):7-18. 被引量：63
3钟祖昌.研发创新SBM效率的国际比较研究——基于OECD国家和中国的实证分析[J].财经研究,2011,37(9):80-90. 被引量：23
4刘宝瑞,张双双.虚拟学习社区知识构件的交流机理研究[J].情报科学,2012,30(11):1603-1608. 被引量：6
5丁敬达,杨思洛,邱均平.论学术虚拟社区知识交流模式[J].情报理论与实践,2013,36(1):64-68. 被引量：35
6王学东,杜晓曦,石自更.面向学术博客知识交流的社会网络中心性分析[J].情报科学,2013,31(3):3-8. 被引量：30
7郑璐.论坛虚拟学习社区的知识交流模式——以“小木虫论坛”为例[J].高校图书情报论坛,2014(1):37-39. 被引量：4
8宗乾进,吕鑫,袁勤俭,易斯琦.学术博客的知识交流效果评价研究[J].情报科学,2014,32(12):72-76. 被引量：29
9万莉.学术虚拟社区知识交流效率测度研究[J].情报杂志,2015,34(9):170-173. 被引量：37
10查建平.旅游业能源消费、CO_2排放及低碳效率评估[J].中国人口·资源与环境,2016,26(1):47-54. 被引量：14

引证文献1

1吴佳玲,庞建刚.基于SBM模型的虚拟学术社区知识交流效率评价[J].情报科学,2017,35(9):125-130. 被引量：23

二级引证文献23

1孙思阳.基于模糊层次分析法的虚拟学术社区用户知识交流效果评价研究[J].情报科学,2020,0(2):22-28. 被引量：15
2孙思阳,张海涛,任亮,尹慧子.虚拟学术社区用户知识交流行为研究综述[J].情报科学,2019,37(1):171-176. 被引量：20
3程豪杰,张宁,袁勤俭.学术虚拟社区知识交流的研究进展[J].现代情报,2018,38(5):158-163. 被引量：13
4庞建刚,吴佳玲.基于SFA方法的虚拟学术社区知识交流效率研究[J].情报科学,2018,36(5):104-109. 被引量：22
5杨瑞仙,权明喆,武亚倩,魏子瑶.学术虚拟社区科研人员知识交流效率感知调查研究[J].图书与情报,2018(6):72-83. 被引量：18
6胡德华,张又月,罗爱静.基于遗传投影寻踪算法的学术虚拟社区知识交流效率研究[J].图书馆论坛,2019,39(4):67-73. 被引量：14
7王战平,周阳,谭春辉,朱宸良.心理契约的履行对虚拟学术社区科研人员EVLN行为的影响[J].现代情报,2020,40(1):49-57. 被引量：2
8秦宜,庞建刚,吴景海,高云志.基于主成分分析的虚拟学术社区科研人员合作影响因素研究--以“小木虫”论坛为例[J].情报探索,2020,0(5):46-52. 被引量：3
9王战平,汪玲,谭春辉,朱宸良.虚拟学术社区中科研人员合作效能影响因素的实证研究[J].情报科学,2020,38(5):11-19. 被引量：4
10谭旸,秦渴,袁勤俭.激励机制对学术虚拟社区知识贡献效果的影响研究[J].现代情报,2020,40(9):106-116. 被引量：11

1张友能,王德兵,汪伟.Parzen窗核密度估计的模式分类隐私保护方法[J].淮南师范学院学报,2014,16(5):93-96.
2李红莲,王春花,袁保宗,朱占辉.针对大规模训练集的支持向量机的学习策略[J].计算机学报,2004,27(5):715-719. 被引量：53
3牛晓太.基于KNN算法和10折交叉验证法的支持向量选取算法[J].华中师范大学学报（自然科学版）,2014,48(3):335-338. 被引量：18
4家会臣,靳竹萱,李济洪.Logistic模型选择中三种交叉验证策略的比较[J].太原师范学院学报（自然科学版）,2012,11(1):87-90. 被引量：5
5王石磊,陆慧娟,关伟,余翠.一种粒子群RELM的基因表达数据分类方法[J].中国计量学院学报,2015,26(2):221-226. 被引量：2
6徐启华,耿帅,师军.基于大规模训练集SVM的发动机故障诊断[J].航空动力学报,2011,26(12):2841-2848. 被引量：7
7陈兴亮,李永忠,于化龙.基于IPMeans-KELM的入侵检测算法研究[J].计算机工程与应用,2016,52(22):118-122. 被引量：8
8邓京璟,叶晓俊.基于R树多维K-匿名算法[J].计算机工程,2008,34(1):80-82. 被引量：4
9刘年义,魏跃进.SVM的快速分类及其算法[J].焦作师范高等专科学校学报,2009,25(4):75-77.
10薛贞霞,刘三阳,齐小刚.基于壳向量和中心向量的支持向量机[J].数据采集与处理,2009,24(3):328-334. 被引量：3

科技导报

2014年第36期

浏览历史

内容加载中请稍等...

Parzen窗核密度估计的大规模数据模式分类隐私保护方法被引量：1

参考文献11

二级参考文献84

共引文献230

同被引文献10

引证文献1

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

Parzen窗核密度估计的大规模数据模式分类隐私保护方法 被引量：1

参考文献11

二级参考文献84

共引文献230

同被引文献10

引证文献1

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

Parzen窗核密度估计的大规模数据模式分类隐私保护方法被引量：1