-
题名一种新的聚类有效性函数
被引量:8
- 1
-
-
作者
彭勇
吴友情
-
机构
中国科学院研究生院
中国科学院沈阳计算技术研究所
安徽大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第6期124-126,132,共4页
-
文摘
聚类有效性函数是用于评价聚类结果优劣的指标,准确地给出初始聚类类别数将使得聚类结果趋于合理化。根据模糊不确定性理论及聚类问题的基本特性,引入了新的紧密度度量指标Di(U;c),在此基础上提出了一个旨在寻求最优聚类类别数的有效性函数。该函数基于数据集的紧密度与分离度特征,综合考虑了数据成员的隶属度及数据集的几何结构。实验结果表明该有效性函数能够发现最优的聚类类别数,对于分类结构较为明确的数据集表现出良好的性能,并且对于权重系数具有良好的鲁棒性。
-
关键词
模糊聚类
聚类有效性
模糊C均值
聚类紧密度
聚类分离度
-
Keywords
fuzzy clustering
clustering validity
fuzzy c-means
clustering eompactness
clustering separation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名双重遗传算法在文本聚类中的应用
- 2
-
-
作者
文静
曹妍
牟向伟
-
机构
大连海事大学交通运输管理学院
-
出处
《计算机工程与设计》
北大核心
2016年第9期2435-2439,2458,共6页
-
基金
辽宁省创新团队基金项目(LT2011007)
中国博士后科学基金项目(2014M551063)
+4 种基金
辽宁省教育厅科技研究基金项目(L2014203)
辽宁省社会科学规划基金项目(L14BGL012)
中央高校基本科研业务费专项基金项目(3132015050)
中国博士后科学基金项目(2015M571292)
中央高校基本科研业务费基金项目(3132015049)
-
文摘
为提高文本聚类效果,将影响聚类效果的两大因素聚类数目和初始中心点作为自变量,聚类结果的适应度作为因变量,利用双重遗传算法控制两大自变量,提出TCDGK算法模型。引入经典的k-means聚类算法获得不同初始中心点下的聚类结果,针对内外层遗传算法控制的变量的差异,采用分层编码策略,利用聚类紧密度评价聚类结果的优劣;算法终止后,获得相对最优的聚类数和某聚类数目下的最优初始中心点。仿真结果表明,该算法具有很好的有效性。
-
关键词
双重遗传算法
聚类紧密度
分层编码
K-MEANS算法
文本聚类
-
Keywords
double genetic algorithm
clustering compaction
hierarchical coding
k-means algorithm
text clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-