-
题名基于扩展和网格的多密度聚类算法
被引量:25
- 1
-
-
作者
邱保志
沈钧毅
-
机构
西安交通大学电子与信息工程学院
-
出处
《控制与决策》
EI
CSCD
北大核心
2006年第9期1011-1014,1019,共5页
-
基金
国家自然科学基金项目(60173058)
-
文摘
提出了网格密度可达的聚类概念和边界处理技术,并在此基础上提出一种基于扩展的多密度网格聚类算法.该算法使用网格技术提高聚类的速度,使用边界处理技术提高聚类的精度,每次聚类均从最高的密度单元开始逐步向周围扩展形成聚类.实验结果表明,该算法能有效地对多密度数据集和均匀密度数据集进行聚类,具有聚类精度高等优点.
-
关键词
聚类算法
多密度数据集
边界处理
扩展聚类
网格聚类
-
Keywords
Clustering algorithm
Multi-density data set
Boundary point extraction
Extend-based clustering Gird-based clustering
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于主动数据选取的半监督聚类算法
- 2
-
-
作者
文平
冷明伟
陈晓云
-
机构
兰州大学信息科学与工程学院
上饶师范学院数学与计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2012年第8期2841-2844,共4页
-
基金
江西省教育厅科技课题资助项目(GJJ11609)
-
文摘
利用少量标签数据获得较高聚类精度的半监督聚类技术是近年来数据挖掘和机器学习领域的研究热点。但是现有的半监督聚类算法在处理极少量标签数据和多密度不平衡数据集时的聚类精度比较低。基于主动学习技术研究标签数据选取,提出了一个新的半监督聚类算法。该算法结合最小生成树聚类和主动学习思想,选取包含信息较多的数据点作为标签数据,使用类KNN思想对类标签进行传播。通过在UCI标准数据集和模拟数据集上的测试,结果表明提出的算法比其他算法在处理多密度、不平衡数据集时有更高精度且稳定的聚类结果。
-
关键词
数据挖掘
半监督聚类
主动学习
标签数据
数据选取
最小生成树
多密度数据集
不平衡数据集
-
Keywords
data mining
semi-supervised clustering
active learning
labeled data
data selection
minimum spanning tree
multi-density dataset
unbalanced dataset
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名SCMDFC算法研究与应用
- 3
-
-
作者
赵双柱
-
机构
兰州文理学院电子信息工程学院
-
出处
《网络安全技术与应用》
2014年第4期85-86,共2页
-
文摘
针对SCMD算法存在的两大不足提出了改进,改进的半监督聚类算法在原算法的基础上添加对两种问题的处理,问题一的解决方法是查找可能会丢失的簇,添加Eps,以解决先验约束不充分时不能检测到所有的簇;问题二的解决方法是分配边界簇,以解决簇内多密度问题。实验证明SCMDFC算法在处理多密度数据集时具有良好的聚类质量。
-
关键词
SCMD
SCMDFC
多密度数据集
-
Keywords
SCMD
SCMDFC
multidimensional data set
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP391.41
[自动化与计算机技术—计算机应用技术]
-