-
题名基于变长聚类的多敏感属性概率k-匿名算法
被引量:4
- 1
-
-
作者
唐印浒
钟诚
-
机构
广西大学计算机与电子信息学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2014年第8期2660-2665,共6页
-
基金
广西自然科学基金项目(2011GXNSFA018152)
广西研究生教育创新计划基金项目(YCSZ2012007)
-
文摘
充分考虑记录之间的距离以及记录本身权重值对聚类种子选择的影响,建立聚类种子选取模型,以获得更好的聚类结果。提出基于改进变长聚类的多敏感属性概率k-匿名算法,以提高数据可用性;提出融合k-means与改进变长聚类算法的概率k-匿名算法,采用多线程并行技术,在不降低信息损失度与匿名质量的前提下,提升处理大数据集的效率。实验结果表明,所提算法效率较高,其生成的匿名数据集具有较好的数据可用性。
-
关键词
数据发布
多敏感属性
概率κ-匿名
变长聚类
并行线程
-
Keywords
data publishing
multiple sensitive attributes
probabilistic κ-anonymity
variable-length clustering
parallel threads
-
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
-
-
题名一种基于变长聚类的个性化匿名保护方法
被引量:3
- 2
-
-
作者
李丹
凌捷
-
机构
广东工业大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2018年第8期85-90,共6页
-
基金
广东省科技计划项目(No.2014A010103029
No.2014B090908010
+2 种基金
No.2015B010128014)
广州市重大科技专项(No.201604010048
No.201604010077)
-
文摘
针对链接攻击导致的隐私泄露问题,以及为了尽可能减少匿名保护时产生的信息损失,提高发布数据集的可用性,提出一种面向个体的基于变长聚类的个性化匿名保护方法。该方法充分考虑记录权重值对聚类簇中心结果的影响,以提高数据的可用性,并对敏感属性值进行分级处理,将敏感属性值分成三个等级类,响应不同个体的保护需求。理论分析和实验结果表明,该方法能满足敏感属性个性化保护需求,同时可有效地降低信息损失,效率较高,生成的匿名数据集具有较好的可用性。
-
关键词
隐私保护
数据发布
变长聚类
个性化匿名
信息损失
-
Keywords
privacy protection
data publishing
variable-length clustering
personalization anonymization
information loss
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-