-
题名基于分类的加速EM缺失数据填充算法
被引量:1
- 1
-
-
作者
孙华艳
李业丽
字云飞
韩旭
管欣鑫
周楚风
-
机构
北京印刷学院信息工程学院
-
出处
《北京印刷学院学报》
2018年第9期98-102,共5页
-
基金
北京市科技创新服务能力协调创新项目(PXM2016_014223_000025)
-
文摘
在数据挖掘的整个过程中,EM算法因其数值计算的稳定性、实现上的简单性,可靠的全局收敛性,被广泛应用于处理数据不完整问题。针对EM算法收敛速度慢,算法高度依赖初始值的选择,使用KNN算法的分类结果作为EM算法的初始使用范围,KNN算法根据挖掘目的的不同选择不同的特性,然后利用增量式EM(IEM)算法按E步M步迭代反复求精,快速有效地得出填充缺失数据的最优值;该算法大大加快了收敛速度,加强了聚类的稳定性,数据填充效果显著。
-
关键词
KNN分类
em算法
增量式em算法
收敛速度
稳定聚类
缺失数据填充
-
Keywords
KNN classification
em algoritbm
incremental em algoritbm
convergence speed
stableclustering
missing data filling
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-