-
题名基于概率矩阵分解的不完整数据集特征选择方法
- 1
-
-
作者
范林歌
武欣嵘
童玮
曾维军
-
机构
中国人民解放军陆军工程大学通信工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第6期57-64,共8页
-
基金
国家自然科学基金(61802425)。
-
文摘
在机器学习理论与应用中,特征选择是降低高维数据特征维度的常用方法之一。传统的特征选择方法多数基于完整数据集,对实际应用中普遍存在缺失数据的情形研究较少。针对不完整数据中含有未被观察信息和存在异常值的特点,提出一种基于概率矩阵分解技术的鲁棒特征选择方法。使用基于分簇的概率矩阵分解模型对数据集中的缺失值进行近似估计,以有效测量相邻簇之间数据的相似性,缩小问题规模,同时降低填充误差。依据缺失数据值存在少量异常值的情形,利用基于l_(2,1)损失函数的方法进行特征选择,在此基础上给出不完整数据集的特征选择方法流程,并对其收敛性进行理论分析。该方法利用不完整数据集中的所有信息,有效应对不完整数据集中异常值带来的影响。实验结果表明,相比传统特征选择方法,该方法在合成数据集上选择更少的无关特征,可降低异常值带来的影响,在真实数据集上获得了较高的分类准确率,能够选择出更为准确的特征。
-
关键词
矩阵分解
缺失值填补
鲁棒特征选择
不完整数据
l_(2
1)范数
-
Keywords
matrix decomposition
missing value filling
Robust Feature Selection(RFS)
incomplete data
?_(2,1)norm
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于矩阵分解填充的无监督特征选择方法
- 2
-
-
作者
范林歌
武欣嵘
童玮
曾维军
-
机构
陆军工程大学
-
出处
《通信技术》
2021年第8期1853-1861,共9页
-
基金
国家自然科学基金(No.61802425)。
-
文摘
无监督特征选择(Unsupervised Feature Selection,UFS)是一种应用广泛的大数据降维技术,然而传统的无监督特征选择算法并不适用于不完整数据集。近年来研究不完整数据下无监督特征选择的关键是如何依靠不完整数据中的信息以获得特征的紧凑筛选。针对不完整数据集的信息利用不够完全以及现有方法填充不够准确的特点,提出基于矩阵分解填充的无监督特征选择方法。该方法利用所有已知信息对不完整数据集进行填充,之后利用基于l_(2.1)范数的无监督最大间隔特征选择方法进行特征选择。实验结果表明,该算法提高了聚类精度和填充效果。
-
关键词
矩阵分解
缺失值填补
无监督特征选择(UFS)
l_(2.1)范数
-
Keywords
matrix decomposition
missing value filling
unsupervised feature selection
l_(2.1)norm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-