期刊文献+
共找到92篇文章
< 1 2 5 >
每页显示 20 50 100
高效率的K-means最佳聚类数确定算法 被引量:64
1
作者 王勇 唐靖 +1 位作者 饶勤菲 袁巢燕 《计算机应用》 CSCD 北大核心 2014年第5期1331-1335,共5页
针对K-means聚类算法通常无法事先设定聚类数,而人为设定初始聚类数目容易导致聚类结果不够稳定的问题,提出一种新的高效率的K-means最佳聚类数确定算法。该算法通过样本数据分层来得到聚类数搜索范围的上界,并设计了一种聚类有效性指... 针对K-means聚类算法通常无法事先设定聚类数,而人为设定初始聚类数目容易导致聚类结果不够稳定的问题,提出一种新的高效率的K-means最佳聚类数确定算法。该算法通过样本数据分层来得到聚类数搜索范围的上界,并设计了一种聚类有效性指标来评价聚类后类内与类间的相似性程度,从而在聚类数搜索范围内获得最佳聚类数。仿真实验结果表明,该算法能够快速、高效地获得最佳聚类数,对数据集聚类效果良好。 展开更多
关键词 k-means 据分层 有效性指标 相似性程度 最佳
下载PDF
基于聚类中心优化的k-means最佳聚类数确定方法 被引量:27
2
作者 贾瑞玉 宋建林 《微电子学与计算机》 CSCD 北大核心 2016年第5期62-66,71,共6页
k-means聚类算法是在确定的聚类数k下对数据集进行聚类,通常凭借先验规则假定一个k值,取值具有很大主观性;此外,k-means初始聚类中心的选择一般也是随机的,这使得k-means聚类经常出现聚类指标局部最优化,聚类结果不稳定.针对以上两个问... k-means聚类算法是在确定的聚类数k下对数据集进行聚类,通常凭借先验规则假定一个k值,取值具有很大主观性;此外,k-means初始聚类中心的选择一般也是随机的,这使得k-means聚类经常出现聚类指标局部最优化,聚类结果不稳定.针对以上两个问题,结合密度法改进了k-means初始聚类中心点的选择,并在此基础上提出了一种确定k-means最佳聚类数的方法.实验结果证明,该方法可以得到更好的聚类结果,具有更高的准确性、更好的稳定性以及更优的收敛性. 展开更多
关键词 k-means 初始中心 样本密度
下载PDF
K-means算法最佳聚类数确定方法 被引量:140
3
作者 周世兵 徐振源 唐旭清 《计算机应用》 CSCD 北大核心 2010年第8期1995-1998,共4页
K-means聚类算法是以确定的类数k为前提对数据集进行聚类的,通常聚类数事先无法确定。从样本几何结构的角度设计了一种新的聚类有效性指标,在此基础上提出了一种新的确定K-means算法最佳聚类数的方法。理论研究和实验结果验证了以上算... K-means聚类算法是以确定的类数k为前提对数据集进行聚类的,通常聚类数事先无法确定。从样本几何结构的角度设计了一种新的聚类有效性指标,在此基础上提出了一种新的确定K-means算法最佳聚类数的方法。理论研究和实验结果验证了以上算法方案的有效性和良好性能。 展开更多
关键词 k-means 有效性指标 分析
下载PDF
基于K-means算法的最佳聚类数研究 被引量:14
4
作者 王艳娥 梁艳 +1 位作者 司海峰 丁心安 《电子设计工程》 2020年第24期52-56,共5页
针对聚类算法在实现的过程中需要预先设定最终聚类数目的问题,提出了基于同类全部样本的类内紧密度和类间离差度的一种新聚类有效性指标,通过该指标能够有效地确定数据集的最佳聚类簇数。在确定最佳聚类数的过程中采用K-means算法,针对K... 针对聚类算法在实现的过程中需要预先设定最终聚类数目的问题,提出了基于同类全部样本的类内紧密度和类间离差度的一种新聚类有效性指标,通过该指标能够有效地确定数据集的最佳聚类簇数。在确定最佳聚类数的过程中采用K-means算法,针对K-means算法随机选择初始聚类中心的缺陷,提出以欧式距离度量样本相似度,基于样本方差,选出方差最小的前K个样本作为初始聚类中心,避免噪声点成为初始聚类中心,使得选择的初始聚类中心位于样本集稠密区域,Kmeans聚类的结果稳定有效。使用优化K-means算法和新的聚类有效性指标确定数据集的簇数,通过在UCI数据集和人工模拟数据集上测试,证明文本算法在球形且噪声点较少的样本集中,能够有效地找出最佳的类数且算法运行速度快。 展开更多
关键词 k-means 有效性指标 分析
下载PDF
基于K-means的最佳聚类数确定方法研究 被引量:3
5
作者 李红岩 胡林林 +1 位作者 王江波 周红芳 《电脑知识与技术》 2014年第1期110-114,共5页
确定数据集的最佳聚类数是聚类研究中的一个重要难题。为了更有效地确定数据集的最佳聚类数,该文提出了通过改进K-means算法并结合一个不依赖于具体算法的有效性指标Q(c)对数据集的最佳聚类数进行确定的方法。理论分析和实验结果证... 确定数据集的最佳聚类数是聚类研究中的一个重要难题。为了更有效地确定数据集的最佳聚类数,该文提出了通过改进K-means算法并结合一个不依赖于具体算法的有效性指标Q(c)对数据集的最佳聚类数进行确定的方法。理论分析和实验结果证明了该方法具有良好的性能和有效性。 展开更多
关键词 最佳 有效性指标
下载PDF
K-means算法最佳聚类数评价指标研究 被引量:20
6
作者 郭靖 侯苏 《软件导刊》 2017年第11期5-8,共4页
聚类分析广泛应用于商务智能、图像模式识别、Web搜索、生物学等领域,是一种无指导的观察式学习。然而,绝大多数聚类分析算法都面临着一个非常棘手的问题——最佳聚类数的确定。K-means是典型的基于划分的聚类方法,它需要用户输入聚类... 聚类分析广泛应用于商务智能、图像模式识别、Web搜索、生物学等领域,是一种无指导的观察式学习。然而,绝大多数聚类分析算法都面临着一个非常棘手的问题——最佳聚类数的确定。K-means是典型的基于划分的聚类方法,它需要用户输入聚类数K,但这通常非常困难。聚类数的确定是决定聚类质量的关键因素。虽然有许多被用来估计最优聚类数的聚类评价指标,但对于不同的聚类算法,不同的评价指标效果差异很大。为确定针对K-means聚类算法效果最好的评价指标,采用4种典型的不同聚类结构特征的人工模拟数据以及来自UCI的真实数据集对7种评价指标的性能进行实验比较,结果表明CH指标和I指标在评估K-means算法的最佳聚类数时效果较好。 展开更多
关键词 指标 k-means算法 分析
下载PDF
基于聚类数和初始值的K-means算法改进研究 被引量:6
7
作者 屈新怀 高万里 +1 位作者 丁必荣 李朕 《组合机床与自动化加工技术》 北大核心 2011年第4期42-46,共5页
原始的K-means算法,随机生成初始质心,事先给定聚类数k,在该前提下进行聚类,大大降低了聚类的效果。文章是对原始K-means算法的改进,提出了一种基于密度选取初始质心和采取遗传算法优化聚类数k的算法。该算法在一定程度上解决了初始质... 原始的K-means算法,随机生成初始质心,事先给定聚类数k,在该前提下进行聚类,大大降低了聚类的效果。文章是对原始K-means算法的改进,提出了一种基于密度选取初始质心和采取遗传算法优化聚类数k的算法。该算法在一定程度上解决了初始质心和聚类数k对聚类精度和效率的影响,提高了聚类的准确率。最后文章通过实验证明了改进算法的有效性。 展开更多
关键词 k-means算法 初始质心 k
下载PDF
基于加权二分图的K均值最佳聚类数确定算法 被引量:4
8
作者 林伟杰 王勇 周林 《计算机工程与设计》 北大核心 2023年第4期1104-1111,共8页
针对传统K均值算法无法精确预设初始聚类中心数目的问题,提出基于加权二分图的K均值最佳聚类数确定算法。设计等比例随机采样的方式,从原始大数据集中产生小数据集集合并从中产生聚类中心点点集,提高应对大规模数据集的能力;用聚类中心... 针对传统K均值算法无法精确预设初始聚类中心数目的问题,提出基于加权二分图的K均值最佳聚类数确定算法。设计等比例随机采样的方式,从原始大数据集中产生小数据集集合并从中产生聚类中心点点集,提高应对大规模数据集的能力;用聚类中心点点集形成二分图,针对聚类算法特性改进其赋权函数;设计评价数,改进Kuhn-Munkres算法,将其用于求取二分图的最大权完美匹配,确定最佳聚类数。实验结果表明,相较其它6种对比算法,所提算法有更高的准确性,更好的稳定性,以及更强的处理大规模数据集能力。 展开更多
关键词 K均值 初始中心 随机采样 二分图 Kuhn-Munkres算法 最佳 完美匹配
下载PDF
结合密度参数与中心替换的改进K-means算法及新聚类有效性指标研究 被引量:12
9
作者 张亚迪 孙悦 +1 位作者 刘锋 朱二周 《计算机科学》 CSCD 北大核心 2022年第1期121-132,共12页
聚类是一种经典的数据挖掘技术,它在模式识别、机器学习、人工智能等多个领域得到了广泛的应用。通过聚类分析,目标数据集的深层次结构可以被有效地发掘出来。作为一种常用的划分聚类算法,K-means具有实现简单、能够处理大型数据等优点... 聚类是一种经典的数据挖掘技术,它在模式识别、机器学习、人工智能等多个领域得到了广泛的应用。通过聚类分析,目标数据集的深层次结构可以被有效地发掘出来。作为一种常用的划分聚类算法,K-means具有实现简单、能够处理大型数据等优点。然而,受收敛规则的影响,K-means算法仍然存在着对初始类簇中心的选取非常敏感、不能很好地处理非凸型分布和有离群值的数据集等问题。文中提出了一种基于密度参数和中心替换的改进K-means算法DC-Kmeans。该算法采用数据对象的密度参数来逐步确定初始类簇中心,使用中心替换方法更新偏离实际位置的初始中心,因而比传统聚的类算法更加精确。为了获得最佳聚类效果,文中同时提出了一个能够对聚类结果进行有效评价的新聚类有效性指标SCVI和一个能够快速获得目标数据集最佳类簇数的新算法OCNS。实验结果表明,所提聚类方法对各种类型的数据集都是有效的。 展开更多
关键词 算法 有效性指标 最佳 簇中心 据挖掘
下载PDF
基于K-means最佳聚类的间歇过程故障诊断方法 被引量:2
10
作者 邵盟雅 吕锋 +1 位作者 宋学君 郭振兴 《控制工程》 CSCD 北大核心 2020年第9期1642-1648,共7页
在多时段间歇过程中,过程特性区域存在于两个相邻时段间的模糊过渡区域中。若不能准确将过渡时段提取出来,在采用多向主元分析(MPCA)方法进行故障诊断与分析过程中容易产生误判。为此,提出了一种基于K-means最佳聚类的间歇过程故障诊断... 在多时段间歇过程中,过程特性区域存在于两个相邻时段间的模糊过渡区域中。若不能准确将过渡时段提取出来,在采用多向主元分析(MPCA)方法进行故障诊断与分析过程中容易产生误判。为此,提出了一种基于K-means最佳聚类的间歇过程故障诊断方法。该方法首先在传统软时段划分中加入K-means最佳聚类方法,提高了子时段与过渡时段的区分度;然后利用MPCA诊断方法进行诊断分析。此方法提高了过渡时段的区分度,进而提升了故障诊断的精度。通过机床设备加工数据的仿真实验,证明了方法的有效性。 展开更多
关键词 MPCA k-means 最佳 软时段划分 故障诊断
下载PDF
K-means聚类数的确定及在细胞图像颜色校正中的应用 被引量:1
11
作者 罗丽丽 蔡坚勇 +2 位作者 蔡荣太 林李金 蔡娟 《计算机系统应用》 2014年第1期114-118,共5页
针对大量瑞氏染色细胞图像,通过YCbCr颜色空间进行K-means聚类,观察各分量聚类中心差值变化规律,提出了一种新的确定K-means聚类数的颜色校正算法.该算法首先是将瑞氏染色细胞图像中不同目标分别准确地聚集在相应类当中,再与标准图像中... 针对大量瑞氏染色细胞图像,通过YCbCr颜色空间进行K-means聚类,观察各分量聚类中心差值变化规律,提出了一种新的确定K-means聚类数的颜色校正算法.该算法首先是将瑞氏染色细胞图像中不同目标分别准确地聚集在相应类当中,再与标准图像中的每类进行配比,并利用直方图规定化进行直方图调整,得到颜色校正结果.经大量实验证明,尤其在细胞图像中目标颜色特征较接近的情况下,该算法通过确定合适的聚类数可大大提高颜色校正结果的准确率. 展开更多
关键词 k-means 中心差值 颜色校正 准确率
下载PDF
自适应确定K-means算法的聚类数:以遥感图像聚类为例 被引量:3
12
作者 袁周米琪 周坚华 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第6期73-80,89,共9页
聚类数直接关系到聚类算法的聚类质量,但在K-means等经典聚类算法中,对于聚类数的确定目前尚无合适的理论,一般凭经验或试凑指定.这样不仅需要较多的人机交互和耗费较多的试算开销,并且由于最优聚类数常常难以获得,而影响聚类结果的精度... 聚类数直接关系到聚类算法的聚类质量,但在K-means等经典聚类算法中,对于聚类数的确定目前尚无合适的理论,一般凭经验或试凑指定.这样不仅需要较多的人机交互和耗费较多的试算开销,并且由于最优聚类数常常难以获得,而影响聚类结果的精度.本文提出一种自适应逼近最佳聚类数的算法ADNC(adaptively determining the number of clusters),可以通过自适应方法逼近最优聚类数.逼近是一个反复迭代聚类的过程.每迭代一次,对输出的聚类评估分类空间各图像特征值(输入向量各分量)标准差的平均误差,并构成多特征综合误差;根据梯度下降原理调整聚类数,即在使多特征综合误差逐步减小的同时,逼近最优聚类数.这个最优聚类数一般出现在多特征综合误差开始震荡之前最邻近的位置.以这个聚类数做K-means聚类,可以使同类间特征值异质性降到最小,取得理想的聚类结果.与此同时,还提出了较不适宜聚类数的概念,即可能使聚类误差最大的聚类数.实验表明,最适宜和较不适宜的聚类数两个概念对于改善聚类精度都有实践意义. 展开更多
关键词 k-means 自适应
下载PDF
基于改进K-means聚类k值选择算法的配网电压数据异常检测 被引量:17
13
作者 刘明群 何鑫 +2 位作者 覃日升 姜訸 孟贤 《电力科学与技术学报》 CAS 北大核心 2022年第6期91-99,共9页
K-means聚类算法因计算速度快、准确率高等优势被应用于大规模配电网数据异常检测,但当聚类数不合适时,可能导致聚类结果不理想。为此,提出一种基于改进elbow method和轮廓系数的聚类数选择算法IES,首先,该算法利用elbow method的聚类... K-means聚类算法因计算速度快、准确率高等优势被应用于大规模配电网数据异常检测,但当聚类数不合适时,可能导致聚类结果不理想。为此,提出一种基于改进elbow method和轮廓系数的聚类数选择算法IES,首先,该算法利用elbow method的聚类评价指标和聚类数上限,确定随数据集不同而自适应变化的阈值,通过自适应阈值求解聚类数下限;其次,在聚类数上下限内计算轮廓系数,并提出“一个极大值”规则避免计算所有轮廓系数,提高算法速度;最后,利用轮廓系数选取合适聚类数,并通过召回率评价异常检测效果,说明为K-means聚类算法选取合适聚类数对异常检测的重要性。算例结果表明:IES算法能在自适应获取最佳聚类数的同时大大削减计算时间,提高K-means算法在线监测的准确率和高效性。 展开更多
关键词 配电网电压 在线监测 k-means算法 最佳
下载PDF
模糊聚类分析最佳聚类数的确定方法研究 被引量:84
14
作者 孙才志 王敬东 潘俊 《模糊系统与数学》 CSCD 2001年第1期89-92,共4页
根据方差分析理论 ,提出应用混合 F统计量来确定最佳分类数 ,并应用模糊划分熵来验证最佳分类数的正确性 ,综合运用上述两个指标可以准确确定最佳聚类数。
关键词 混合F统计量 模糊划分熵 最佳 模糊分析 ISODATA算法
下载PDF
核聚类算法最佳聚类数的自适应确定方法 被引量:9
15
作者 普运伟 朱明 +1 位作者 金炜东 胡来招 《计算机工程》 CAS CSCD 北大核心 2007年第4期11-13,共3页
在分析核函数所隐式描述的样本间成对相似性的基础上,该文从统计的角度分别定义了能反映类内(类间)样本相似性的类内(类间)个体平均相似系数,设计了一个高效的评价核聚类算法聚类质量的有效性指标。该指标具有物理意义清晰、计算简洁以... 在分析核函数所隐式描述的样本间成对相似性的基础上,该文从统计的角度分别定义了能反映类内(类间)样本相似性的类内(类间)个体平均相似系数,设计了一个高效的评价核聚类算法聚类质量的有效性指标。该指标具有物理意义清晰、计算简洁以及对核参数具备一定鲁棒性的优点。在此基础上,提出了一个能自动确定最佳聚类数目和最佳划分的自适应核聚类(SAKC)算法。Benchmarks实验结果验证了所提出的聚类有效性指标及其SAKC算法的有效性和良好性能。 展开更多
关键词 有效性 最佳 相似性
下载PDF
气象数据概化中的最佳聚类数研究 被引量:5
16
作者 赵超 舒红 +1 位作者 朱欣焰 戴上平 《华中师范大学学报(自然科学版)》 CAS CSCD 2008年第3期490-493,499,共5页
以黑龙江省中部地区2004年的气温和降水观测数据为实例,对数据挖掘中气象数据的概化问题进行研究.调查分析了概化方法和数据特征,确定采用模糊C均值聚类算法.重点研究了算法中最佳聚类数的确定,选取多种广泛认可的指标,对聚类结果进行... 以黑龙江省中部地区2004年的气温和降水观测数据为实例,对数据挖掘中气象数据的概化问题进行研究.调查分析了概化方法和数据特征,确定采用模糊C均值聚类算法.重点研究了算法中最佳聚类数的确定,选取多种广泛认可的指标,对聚类结果进行有效性对比分析,采用综合最优的聚类数为最佳聚类数.研究发现这种方法聚类结果合理且具有较强的可拓展性. 展开更多
关键词 模糊 气象 FCM 最佳
下载PDF
基于最小生成树的层次K-means聚类算法 被引量:18
17
作者 贾瑞玉 李振 《微电子学与计算机》 CSCD 北大核心 2016年第3期86-88,93,共4页
针对K-means算法初始化时需要指定聚类数目,和随机选择初始聚类中心对聚类结果产生不稳定的问题,结合图论中最小生成树和层次算法的分裂、凝聚思想,提出一种基于最小生成树的层次K-means算法.该算法初始时根据数据样本生成一颗最小生成... 针对K-means算法初始化时需要指定聚类数目,和随机选择初始聚类中心对聚类结果产生不稳定的问题,结合图论中最小生成树和层次算法的分裂、凝聚思想,提出一种基于最小生成树的层次K-means算法.该算法初始时根据数据样本生成一颗最小生成树,然后利用层次分裂思想把数据分成多个较小的簇,通过K-means算法迭代操作得到每次操作的评价函数值来判断是否进行簇的合并,进一步确定聚类簇数目.实验结果证明,该算法能够较准确地判断聚类数目,并且聚类结果的稳定性比基本K-means算法要好. 展开更多
关键词 k-means算法 初始中心 层次结构 最小生成树 PRIM算法
下载PDF
一种结合有效降维和K-means聚类的协同过滤推荐模型 被引量:15
18
作者 郁雪 李敏强 《计算机应用研究》 CSCD 北大核心 2009年第10期3718-3720,3762,共4页
为了克服"维灾"所带来的问题,提出一种基于主成分分析的维数约简方法,并在转换后的低维向量空间上进行K-means聚类算法,以减少目标用户的最近邻搜索范围,代替在超高维空间上逐一寻找最近邻的过程。实验结果证明了新算法的有效... 为了克服"维灾"所带来的问题,提出一种基于主成分分析的维数约简方法,并在转换后的低维向量空间上进行K-means聚类算法,以减少目标用户的最近邻搜索范围,代替在超高维空间上逐一寻找最近邻的过程。实验结果证明了新算法的有效性,特别在目标用户的历史评价信息较少的情况下,也能有较好的预测精度。 展开更多
关键词 协同过滤 主成分分析 约简 k-means
下载PDF
确定最佳聚类数的二阶差分统计法 被引量:1
19
作者 崔建斌 姬安召 张科 《安徽大学学报(自然科学版)》 CAS 北大核心 2017年第2期61-67,共7页
多元统计数据的聚类是分析数据的一类非常重要方法,但是如何确定最佳聚类数往往是比较困难的.针对分析多元统计数据中应用最广泛的方法之一——K均值聚类方法,提出了一种新的二阶差分统计确定最佳聚类数的方法,并将其与CH统计法、Gap统... 多元统计数据的聚类是分析数据的一类非常重要方法,但是如何确定最佳聚类数往往是比较困难的.针对分析多元统计数据中应用最广泛的方法之一——K均值聚类方法,提出了一种新的二阶差分统计确定最佳聚类数的方法,并将其与CH统计法、Gap统计法进行了对比.实证分析表明,论文所提方法更为简单而且有效. 展开更多
关键词 二阶差分 最佳 仿真实验
下载PDF
一种新的最佳聚类数确定方法 被引量:2
20
作者 秦振涛 杨武年 《电子技术应用》 北大核心 2013年第1期109-111,115,共4页
为了更有效地确定数据集的最佳聚类数,提出一种新的确定数据集最佳聚类数的算法。该算法借签层次聚类的思想,一次性地生成所有可能的划分,然后根据有效性指标选择最佳的聚类划分,进而获得最佳聚类数。理论分析和实验结果证明,该算法具... 为了更有效地确定数据集的最佳聚类数,提出一种新的确定数据集最佳聚类数的算法。该算法借签层次聚类的思想,一次性地生成所有可能的划分,然后根据有效性指标选择最佳的聚类划分,进而获得最佳聚类数。理论分析和实验结果证明,该算法具有良好的性能。 展开更多
关键词 层次 最佳 有效性指标
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部