期刊文献+
共找到155篇文章
< 1 2 8 >
每页显示 20 50 100
基于Tukey规则与初始中心点优化的K⁃means聚类改进算法 被引量:2
1
作者 柳菁 邱紫滢 +1 位作者 郭茂祖 余冬华 《数据采集与处理》 CSCD 北大核心 2023年第3期643-651,共9页
针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,... 针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,在核心子集上执行中心点逐个递增优化选择策略,选出初始中心点。在来自UCI的20个数据集上聚类结果表明,本文提出的算法优于K⁃means++聚类算法,有效地提升了聚类性能。 展开更多
关键词 数据挖掘 K⁃means算法 Tukey规则 中心点优化
下载PDF
结合X-means聚类的自适应随机子空间组合分类算法 被引量:5
2
作者 曹鹏 李博 +1 位作者 栗伟 赵大哲 《计算机应用》 CSCD 北大核心 2013年第2期550-553,共4页
针对大规模数据的分类准确率低且效率下降的问题,提出一种结合X-means聚类的自适应随机子空间组合分类算法。首先使用X-means聚类方法,保持原有数据结构的同时,把复杂的数据空间自动分解为多个样本子空间进行分治学习;而自适应随机子空... 针对大规模数据的分类准确率低且效率下降的问题,提出一种结合X-means聚类的自适应随机子空间组合分类算法。首先使用X-means聚类方法,保持原有数据结构的同时,把复杂的数据空间自动分解为多个样本子空间进行分治学习;而自适应随机子空间组合分类器,提升了基分类器的差异性并自动确定基分类器数量,提升了组合分类器的鲁棒性及分类准确性。该算法在人工和UCI数据集上进行了测试,并与传统单分类和组合分类算法进行了比较。实验结果表明,对于大规模数据集,该方法具有更好的分类精度和健壮性,并提升了整体算法的效率。 展开更多
关键词 大规模数据集 x—means 组合分 随机子空间 支持向量机
下载PDF
K-means算法初始聚类中心选择的优化 被引量:50
3
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 K—means算法 初始中心 TDKM算法
下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:62
4
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 K—means算法 初始中心 直方图 最优划分方法
下载PDF
初始中心优化的K-Means聚类算法 被引量:47
5
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 K—means算法 初始中心 优化
下载PDF
基于初始聚类中心优化和维间加权的改进K-means算法 被引量:7
6
作者 王越 王泉 +1 位作者 吕奇峰 曾晶 《重庆理工大学学报(自然科学)》 CAS 2013年第4期77-80,共4页
针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-m... 针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-means算法的聚类结果进行对比分析。实验证明:改进后的算法稳定,且聚类的准确率达到了92%。 展开更多
关键词 K—means算法 初始中心 维间加权 Iris数据集
下载PDF
基于初始中心优化的遗传K-means聚类新算法 被引量:17
7
作者 孙秀娟 刘希玉 《计算机工程与应用》 CSCD 北大核心 2008年第23期166-168,182,共4页
一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出... 一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心。实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点。为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K-means算法(PKM)和遗传算法相结合的混合算法(PGKM),该算法在提高紧凑度(类内距)和分离度(类间距)的同时自动搜索最佳聚类数k,对k个初始中心优化后再聚类,不断地循环迭代,得到满足终止条件的最优聚类。实验证明该算法具有更好的聚类质量和综合性能。 展开更多
关键词 K—means算法 遗传算法
下载PDF
K-means聚类算法的研究 被引量:46
8
作者 韩晓红 胡彧 《太原理工大学学报》 CAS 北大核心 2009年第3期236-239,共4页
为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初... 为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理。将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高。 展开更多
关键词 数据挖掘 K—means算法 初始中心 分析
下载PDF
一种K-means聚类算法的改进与应用 被引量:20
9
作者 张杰 卓灵 朱韵攸 《电子技术应用》 北大核心 2015年第1期125-128,131,共5页
K-means算法是基于距离作为相似性度量的聚类算法,传统的K-means算法存在难以确定中心值个数、受噪声及孤立点影响较大的缺点。对此,利用类间相异度与类内相异度改进初始值K,以尽量减少人工干预;同时计算数据库中每一点与剩余点的距离... K-means算法是基于距离作为相似性度量的聚类算法,传统的K-means算法存在难以确定中心值个数、受噪声及孤立点影响较大的缺点。对此,利用类间相异度与类内相异度改进初始值K,以尽量减少人工干预;同时计算数据库中每一点与剩余点的距离和距离均和,将两者的大小比较作为识别孤立点和噪声点的依据,从而删除孤立点,减少对数据聚类划分的影响。最后将改进后的Kmeans算法应用于入侵检测系统并进行仿真实验,结果表明,基于改进的K-means算法的入侵检测系统一定程度上降低了误报率及误检率,提高了检测的准确率。 展开更多
关键词 数据挖掘 算法 K—means 入侵检测
下载PDF
基于形状相似距离的K-means聚类算法 被引量:8
10
作者 苑津莎 李中 《华北电力大学学报(自然科学版)》 CAS 北大核心 2009年第6期98-103,共6页
把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基... 把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基于形状相似距离的K-means算法比采用传统距离的K-means算法,聚类准确度显著提高。 展开更多
关键词 K—means算法 相似度 距离 形状
下载PDF
一种基于改进PSO的K-means优化聚类算法 被引量:27
11
作者 谢秀华 李陶深 《计算机技术与发展》 2014年第2期34-38,共5页
针对传统的K-means算法对初始聚类中心的选取敏感、容易收敛到局部最优的缺点,提出一种基于改进粒子群优化算法(PSO)的K-means优化聚类算法。该算法利用PSO算法强大的全局搜索能力对初始聚类中心的选取进行优化:通过动态调整惯性权重等... 针对传统的K-means算法对初始聚类中心的选取敏感、容易收敛到局部最优的缺点,提出一种基于改进粒子群优化算法(PSO)的K-means优化聚类算法。该算法利用PSO算法强大的全局搜索能力对初始聚类中心的选取进行优化:通过动态调整惯性权重等参数增强PSO算法的性能;利用群体适应度方差决定算法中前部分PSO算法和后部分Kmeans算法的转换时机;设置变量实时监控各个粒子和粒子群的最优值变化情况,及时地对出现早熟收敛的粒子进行变异操作,从而为K-means算法搜索到全局最优的初始聚类中心,使聚类结果不受初始聚类中心影响,易于获得全局最优解。实验结果表明文中提出的改进算法与传统聚类算法相比具有更高的聚类正确率、更好的聚类质量及全局搜索能力。 展开更多
关键词 K—means算法 粒子群优化算法 全局最优
下载PDF
一种改进的K-means蚁群聚类算法 被引量:11
12
作者 李振 贾瑞玉 《计算机技术与发展》 2015年第12期28-31,共4页
现有的K-means蚁群聚类算法,首先进行K-means聚类算法操作,快速、粗略地确定初始聚类中心,接着根据上一步获得的聚类中心再进行蚁群算法聚类操作,有效地解决蚁群聚类算法收敛速度过慢的问题。研究发现,现有的Kmeans蚁群聚类算法并没有... 现有的K-means蚁群聚类算法,首先进行K-means聚类算法操作,快速、粗略地确定初始聚类中心,接着根据上一步获得的聚类中心再进行蚁群算法聚类操作,有效地解决蚁群聚类算法收敛速度过慢的问题。研究发现,现有的Kmeans蚁群聚类算法并没有改善算法在迭代后期易出现收敛于非全局最优的缺陷。针对这一问题,提出一种改进的Kmeans蚁群聚类算法。每次迭代结束时,随机选择一个或多个簇,再从选中的簇里选择含有信息素最小的节点进行变异操作,把选中的节点变异到其他簇,计算评价值判断变异是否进行。仿真实验结果表明,用F值表示的平均值和最差结果都比原有的算法较好,有效解决了原有算法易收敛于非全局最优及早熟问题,但由于变异操作使算法运行时间相对较长。 展开更多
关键词 K—means算法 蚁群算法 组合 变异
下载PDF
可间断运行的K-means聚类算法 被引量:3
13
作者 黄志华 温步瀛 王国乾 《计算机应用研究》 CSCD 北大核心 2009年第6期2053-2055,2069,共4页
引入事务的恢复机制改进K-means算法,改进后的算法允许在运行过程中的任何时刻停机,重新启动后可在停机前运算成果的基础上继续运算,直至算法结束。改进后的算法使得普通机器条件下针对大数据集运用K-means算法成为可能。改进后的算法... 引入事务的恢复机制改进K-means算法,改进后的算法允许在运行过程中的任何时刻停机,重新启动后可在停机前运算成果的基础上继续运算,直至算法结束。改进后的算法使得普通机器条件下针对大数据集运用K-means算法成为可能。改进后的算法在长达400 h的聚类运算中得到了检验。 展开更多
关键词 K—means算法 恢复机制
下载PDF
K-means初始聚类中心优化算法研究 被引量:6
14
作者 毛韶阳 李肯立 《重庆邮电大学学报(自然科学版)》 2007年第4期422-425,共4页
由于K-means算法对初始中心的依赖性而导致聚类结果可能陷入局部极小,而采用密度函数法的多中心聚类并结合小类合并运算的聚类结果明显优于K-means的聚类结果。该算法的每一次迭代都是倾向于发现超球面簇,尤其对于延伸状的不规则簇具有... 由于K-means算法对初始中心的依赖性而导致聚类结果可能陷入局部极小,而采用密度函数法的多中心聚类并结合小类合并运算的聚类结果明显优于K-means的聚类结果。该算法的每一次迭代都是倾向于发现超球面簇,尤其对于延伸状的不规则簇具有良好的聚类能力。 展开更多
关键词 分析 K—means 多中心算法 合并
下载PDF
基于划分的数据挖掘K-means聚类算法分析 被引量:19
15
作者 曾俊 《现代电子技术》 北大核心 2020年第3期14-17,共4页
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成... 为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K⁃means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 展开更多
关键词 数据挖掘 分析 K⁃means算法 中心选取 K⁃means算法改进 初始中心点
下载PDF
基于k-means聚类算法的试卷成绩分析研究 被引量:20
16
作者 谭庆 《河南大学学报(自然科学版)》 CAS 北大核心 2009年第4期412-415,共4页
研究了k-means聚类算法,并将此算法应用于高校学生试卷成绩分析中.首先对数据进行了预处理,然后使用k-means算法,对学生试卷成绩进行分类评价.用所获得的结果指导学生的学习和今后的教学工作.
关键词 数据挖掘 k—means算法 试卷成绩
下载PDF
改进的K-Means聚类算法在保险客户信用分析中的算法实现 被引量:2
17
作者 宋加升 陈琰 《哈尔滨理工大学学报》 CAS 北大核心 2009年第1期116-119,共4页
针对保险业对客户信息的分析中缺乏考虑客户信用分析的问题,根据聚类分析算法理论和保险公司客户数据库特点,进一步对K-means聚类算法在大样本环境下初始聚类中心的选取提出有效改进,同时选取一家财产保险公司的客户信用数据,来探讨聚... 针对保险业对客户信息的分析中缺乏考虑客户信用分析的问题,根据聚类分析算法理论和保险公司客户数据库特点,进一步对K-means聚类算法在大样本环境下初始聚类中心的选取提出有效改进,同时选取一家财产保险公司的客户信用数据,来探讨聚类算法在保险客户信用分析中的应用. 展开更多
关键词 分析 K—means算法 保险客户
下载PDF
基于满二叉树的二分K-means聚类并行推荐算法 被引量:9
18
作者 陈平华 陈传瑜 《计算机工程与科学》 CSCD 北大核心 2015年第8期1450-1457,共8页
在推荐系统中应用K-means算法聚类可有效降维,然而聚类效果往往依赖于选定的初始中心,并且一旦选定目标簇后,推荐过程只针对目标簇进行,与其他簇无关。针对上述两个问题,提出一种基于满二叉树的二分K-means聚类并行推荐算法。该算法首... 在推荐系统中应用K-means算法聚类可有效降维,然而聚类效果往往依赖于选定的初始中心,并且一旦选定目标簇后,推荐过程只针对目标簇进行,与其他簇无关。针对上述两个问题,提出一种基于满二叉树的二分K-means聚类并行推荐算法。该算法首先反复迭代二分K-means算法,迭代过程中使用簇内凝聚度作为分裂阈值,形成一颗满二叉树;然后通过层次遍历将用户归入到K个叶子节点(簇);最后针对K个簇,应用MapReduce框架进行并行推荐预测。MovieLens上的实验结果表明,该算法可大幅度提高推荐系统准确性,同时增强系统可扩展性。 展开更多
关键词 满二叉树 K—means 推荐算法 MAPREDUCE
下载PDF
基于动态隧道系统的K-means聚类算法研究 被引量:8
19
作者 吕佳 《重庆师范大学学报(自然科学版)》 CAS 2009年第1期73-77,共5页
针对K-means聚类算法易陷入局部极小的问题,利用动态隧道算法在解决全局最优化问题中的有效性,将算法中的动态隧道过程引入到K-means聚类算法中,提出了一种基于动态隧道算法的K-means聚类算法。该算法在K-means聚类算法寻优得到的局部... 针对K-means聚类算法易陷入局部极小的问题,利用动态隧道算法在解决全局最优化问题中的有效性,将算法中的动态隧道过程引入到K-means聚类算法中,提出了一种基于动态隧道算法的K-means聚类算法。该算法在K-means聚类算法寻优得到的局部极小值基础上,利用动态隧道过程寻找更小的能量盆地,再将其值提交给K-means聚类算法进行迭代寻优,重复该过程,直到找到全局最小值。理论分析和仿真实验证明,该算法的聚类效果要优于K-means聚类算法。 展开更多
关键词 K—means算法 全局最优化 目标函数 动态隧道系统 能量盆地
下载PDF
基于复合形遗传算法的K-means优化聚类方法 被引量:2
20
作者 赵锋 薛惠锋 王伟 《航空计算技术》 2006年第5期59-61,64,共4页
针对基本遗传算法所存在的缺点和不足,提出了一种改进的遗传算法———复合形遗传算法,并将其用于K-m eans优化聚类。把复合形法嵌入到遗传算法中,利用复合形法对遗传算法群体中的部分个体进行处理,来改善种群的质量,以加快最优解的搜... 针对基本遗传算法所存在的缺点和不足,提出了一种改进的遗传算法———复合形遗传算法,并将其用于K-m eans优化聚类。把复合形法嵌入到遗传算法中,利用复合形法对遗传算法群体中的部分个体进行处理,来改善种群的质量,以加快最优解的搜索进程。该方法既有复合形法快速高效的特点,又有遗传算法全局性好的特点。算例的结果表明,该方法用于改进K-m eans优化聚类是可行的与有效的。 展开更多
关键词 K—means 遗传算法 复合形 复合形遗传算法 数据挖掘
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部