-
题名一种混杂的多核估计数据填充方法
被引量:5
- 1
-
-
作者
刘思谦
陈志奎
蒋昆佑
胡月明
许瀚
-
机构
大连理工大学软件学院
泛在网络与服务软件重点实验室
华南农业大学信息学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第7期1523-1527,共5页
-
基金
国家自然科学基金项目(U1301253)资助
广东省省级科技计划项目(2015B010110006)资助
-
文摘
不完全数据填充在数据处理和分析中起着重要的作用,并直接影响到数据挖掘和知识发现的结果.大多数现存的数据填充算法有的不能处理混合属性的数据有的参数确定复杂度高.针对这些问题本文提出一种基于多个核函数的混合属性数据填充算法.首先,为了减少干扰和计算量,算法采用带修正线性单元的降噪深度信念网络对缺失数据进行特征提取和聚类.然后,为了减少算法的迭代次数,定义部分距离策略对缺失值进行初始化,这能使算法快速收敛并且提高准确性.最后,对连续和离散变量分别定义核函数,计算它们的概率密度,进而构造一个估计器对缺失值进行填充.实验结果表明,本文提出的算法,可减少参数确定复杂度和迭代次数,同时保证数据填充的精度.
-
关键词
数据填充
核函数
深度信念网络
聚类
-
Keywords
data imputation
kernel function
deep belief network
cluster
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-