-
题名基于新相异度量的模糊K-Modes聚类算法
被引量:2
- 1
-
-
作者
张月琴
陈彩棠
-
机构
太原理工大学计算机科学与技术学院
-
出处
《电脑开发与应用》
2012年第5期32-34,共3页
-
文摘
提出了一种基于新相异度量的模糊K-Modes算法。该算法假定不同属性对聚类结果有不同程度的影响,定义了新的属性值函数,以基于划分相似度的聚类精确度作为聚类结果的评价准则。通过真实数据的实验结果表明,新的基于相异度量的模糊K-Modes算法比传统的模糊K-Modes算法有更好的聚类效果。
-
关键词
K—Modes聚类算法
相异度量
分类属性
-
Keywords
k-modes clustering algorithm,dissimilarity measure ,categorical attribute
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于结构相似性的k-modes算法
被引量:2
- 2
-
-
作者
黄苑华
谢峰
郝志峰
蔡瑞初
-
机构
广东工业大学应用数学学院
佛山科技技术学院数学与大数据学院
广东工业大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2017年第23期102-107,共6页
-
基金
国家自然科学基金(No.61472089)
广东省自然科学基金(No.2014A030308008)
软件新技术国家重点实验室开放课题(No.KFKT2014B23)
-
文摘
聚类是数据挖掘中重要的技术之一,它是按照相似原则将数据进行分类。然而分类型数据的聚类是学习算法中重要而又棘手的问题。传统的k-modes算法采用简单的0-1匹配方法定义两个属性值之间的相异度,没有将整个数据集的分布考虑进来,导致差异性度量不够准确。针对这个问题,提出基于结构相似性的k-modes算法。该算法不仅考虑属性值它们本身的异同,而且考虑了它们在其他属性下所处的结构。从集群识别和准确率两个方面进行仿真实验,表明基于结构相似性的k-modes算法在伸缩性和准确率方面更有效。
-
关键词
聚类分析
分类型数据
相异度度量
结构相似性
k-modes算法
-
Keywords
cluster analysis
categorical data
dissimilarity measure
structural similarity
k-modes algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种改进的K-Modes聚类算法
被引量:7
- 3
-
-
作者
贾彬
梁毅
苏航
-
机构
北京工业大学信息学部
-
出处
《软件导刊》
2019年第6期60-64,69,共6页
-
基金
国家自然科学基金青年项目(61202074)
-
文摘
为了改善传统K-Modes聚类算法相异度度量公式弱化了类内相似性,忽略了属性间差异,以及单一属性值的Modes忽视了某一属性可能存在多属性值组合,且算法受初始中心点影响很大的缺点,基于多属性值Modes的相异度度量方法提出MAV-K-Modes算法,并采用一种基于预聚类的初始中心选取方法。使用UCI数据集进行实验,结果表明,MAV-K-Modes算法相比于传统K-Modes算法,其正确率、类精度和召回率都有明显提升,且MAV-K-Modes算法适合于并行化改造。
-
关键词
聚类算法
相异度度量
初始中心点
多属性值Modes
k-modes
-
Keywords
clustering algorithm
dissimilarity measure
initial center points
multi-attribute value Modes
k-modes
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于量子机制的改进的分类属性数据聚类算法
被引量:2
- 4
-
-
作者
赵正天
赵小强
李炜
-
机构
兰州理工大学电气工程与信息工程学院
-
出处
《兰州理工大学学报》
CAS
北大核心
2009年第3期98-102,共5页
-
基金
甘肃省自然科学基金(3ZS051-A25-032)
甘肃省高校研究生导师基金(050301)
-
文摘
分析量子势能、量子力学中粒子分布机制和针对分类属性数据的量子聚类CQC算法,发现该算法采用传统的Hamming相异性测度计算分类属性数据间的相异性测度,忽略分类属性取值自身的涵义和值间的特征关联,导致其聚类准确性较差.提出一种改进的MCQC算法,能根据数据对象的关联情况计算同属性不同值间的相异性,计算数据对象间的相异性测度,从而提高聚类准确率.仿真实验采用3个数据集,即:大豆疾病、国会投票真实数据集和从KDD-CUP99训练样本集抽取离散属性维构成的人造样本集.实验结果表明,该算法是有效且可行的,对分类属性、二值属性和混合属性数据的聚类准确率明显高于CQC算法.
-
关键词
分类属性数据
量子聚类
聚类算法
相异性度量测度
-
Keywords
categorical attribution data
quantum clustering
clustering algorithm
dissimilarity measure
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-