-
题名基于敏感属性熵的微聚集算法
被引量:14
- 1
-
-
作者
杨静
王超
张健沛
-
机构
哈尔滨工程大学计算机科学与技术学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2014年第7期1327-1337,共11页
-
基金
国家自然科学基金(No.61370083
No.61073043
+3 种基金
No.61073041)
高等学校博士学科点专项科研基金(No.20112304110011
No.20122304110012)
哈尔滨市科技创新人才研究专项资金(优秀学科带头人)(No.2011RFXXG015)
-
文摘
在聚类过程中,不合适的距离度量会导致匿名过程中不必要的信息损失,因此对于不同类型的属性定义一个适当的距离度量一直是个难以解决的问题.本文提出语义属性的概念,并提出编码层次树来表示语义属性,有效地降低了匿名过程中的信息损失.在p-敏感k-匿名模型中,敏感属性值在聚类结果中分布不均匀会导致敏感信息泄露,因此本文提出一种基于敏感属性熵的微聚集算法,并提出匿名保护指数来描述隐私保护程度,在聚类过程中通过保证匿名保护指数最大,来提高敏感属性在聚类结果中分布的均匀程度,以应对背景知识攻击,降低隐私泄漏的风险.最后,通过实验验证了算法的合理性和有效性.
-
关键词
隐私保护
编码层次树
微聚集
p-敏感k-匿名
敏感属性熵
-
Keywords
privacy preserving
code hierarchy tree
micro- aggregation
p- sensitive k-anonymity
sensitive attribute enlropy
-
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
-