-
题名改进的混合属性数据聚类算法
被引量:8
- 1
-
-
作者
赵立江
黄永青
刘玉龙
-
机构
徐州师范大学计算机学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2007年第20期4850-4852,共3页
-
基金
国家自然科学基金项目(70171033)
江苏省高校自然科学基础研究基金项目(07KJ520216)
+1 种基金
江苏省计算机处理技术重点实验室基金项目(X2100112049811)
徐州师范大学青年科研基金项目(03X1B18)
-
文摘
k-prototypes是目前处理数值属性和分类属性混合数据主要的聚类算法,但其聚类结果对初值有明显的依赖性。对k-prototypes初值选取方法进行了分析和研究,提出一种新的改进方法。该方法有更高的稳定性和较强的伸缩性,可减少一定程度的上随机性。实际数据集仿真结果表明,改进算法是正确和有效的。
-
关键词
数据挖掘
聚类
k-原型算法
混合型数据
相异度
-
Keywords
data mining
clustering
k-prototypes
mixture data
dissimilarity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种改进的混合属性数据聚类算法
被引量:1
- 2
-
-
作者
陈丹
王振华
-
机构
广东工业大学计算机学院
-
出处
《电脑知识与技术(过刊)》
2010年第13期2713-2716,共4页
-
文摘
K-prototypes算法是处理混合属性数据的主要聚类算法,但是存在对初值敏感、参数依赖和易受"噪声"干扰等问题。为了克服以上缺点,该文对K-prototypes算法的初始中心点选择进行了研究与分析,提出了一种基于近邻法的初始中心点选择策略对算法进行改进,算法先利用近邻法获得初始中心点集和k值,然后进行K-prototypes运算,最后加入识别异常数据点的规则。改进后的算法成功解决了传统K-prototypes算法的缺陷,而且具有更好的分类精度和稳定性。经实验证明,改进算法是正确和有效的,明显优于传统的K-prototypes算法。
-
关键词
聚类分析
初始中心点
k-原型算法
聚类算法
混合属性数据
-
Keywords
Clustering analysis
Initial center points
k-prototypes
Clustering algorithm
mixed numeric and categorical data
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于混合属性处理的无监督异常检测
被引量:2
- 3
-
-
作者
王晓辉
陈昌爱
-
机构
河南中医学院
-
出处
《福建电脑》
2012年第5期95-97,101,共4页
-
文摘
针对目前入侵检测系统应用时处理类别型数据能力欠缺、误报率高的问题,提出一种改进的无监督异常检测算法。该算法基于k-原型聚类思想对包含混合属性数据聚类,在此基础上运用ID3算法进行分类,有效地解决了k-原型算法的局部最优问题以及对初始聚类数的选取有较强依赖性的问题。实验表明,该算法与现有方法相比具有较好的检测性能并能有效检测出未知入侵行为。
-
关键词
异常检测
k-原型算法
聚类
决策树
混合属性
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-