-
题名基于邻域属性熵的隐私保护数据干扰方法
被引量:16
- 1
-
-
作者
倪巍伟
徐立臻
崇志宏
吴英杰
刘腾腾
孙志挥
-
机构
东南大学计算机科学与工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第3期498-504,共7页
-
基金
江苏省自然科学基金项目(BK2006095)
教育部高等学校博士学科点专项科研基金项目(20040286009)~~
-
文摘
隐私保护微数据发布是数据隐私保护研究的一个热点,数据干扰是隐私保护微数据发布采用的一种有效解决方法.针对隐私保护聚类问题,提出一种隐私保护数据干扰方法NETPA,NETPA干扰方法通过对数据点及邻域点集的分析,借助信息论中熵的理论,提出邻域属性熵和邻域主属性等概念,对原始数据中数据点的邻域主属性值用其k邻域点集内数据点在该属性的均值进行干扰替换,在较好地维持原始数据k邻域关系的情况下达到保护原始数据隐私不泄露的目的.理论分析表明,NETPA干扰方法具有良好地避免隐私泄露的效果,同时可以较好地维持原始数据的聚类模式.实验采用DBSCAN和k-LDCHD聚类算法对干扰前后的数据进行聚类分析比对.实验结果表明,干扰前后数据聚类结果具有较高的相似度,算法是有效可行的.
-
关键词
隐私保护
聚类挖掘
邻域属性熵
邻域主属性
数据干扰
-
Keywords
privacy preserving
clustering
neighborhood entropy of attribute, neighboring mainattribute
data perturbation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-