-
题名混合式的K-匿名特征选择算法
被引量:4
- 1
-
-
作者
杨柳
李云
-
机构
江苏省大数据安全与智能处理重点实验室(南京邮电大学)
南京邮电大学计算机学院、软件学院、网络空间安全学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第12期3521-3526,共6页
-
基金
国家自然科学基金面上项目(61772284)。
-
文摘
K-匿名算法通过对数据的泛化、隐藏等手段使得数据达到K-匿名条件,在隐藏特征的同时考虑数据的隐私性与分类性能,可以视为一种特殊的特征选择方法,即K-匿名特征选择。K-匿名特征选择方法结合K-匿名与特征选择的特点使用多个评价准则选出K-匿名特征子集。过滤式K-匿名特征选择方法难以搜索到所有满足K-匿名条件的候选特征子集,不能保证得到的特征子集的分类性能最优,而封装式特征选择方法计算成本很大,因此,结合过滤式特征排序与封装式特征选择的特点,改进已有方法中的前向搜索策略,设计了一种混合式K-匿名特征选择算法,使用分类性能作为评价准则选出分类性能最好的K-匿名特征子集。在多个公开数据集上进行实验,结果表明,所提算法在分类性能上可以超过现有算法并且信息损失更小。
-
关键词
混合式
过滤式特征排序
封装式特征选择
特征选择
隐私保护
K-匿名
前向搜索策略
-
Keywords
hybrid
filtered feature sorting
wrapper feature selection
feature selection
privacy protection
K-anonymity
forward search strategy
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-