期刊文献+
共找到92篇文章
< 1 2 5 >
每页显示 20 50 100
基于优化K-means算法的高校成绩聚类分析研究
1
作者 张梁 杨立波 +1 位作者 张小勇 史俊冰 《太原学院学报(自然科学版)》 2024年第2期79-84,共6页
针对经典K均值算法在聚类中心易受异常值影响,导致聚类结果不稳定的问题,提出基于样本分布密度的优化K-means算法,以提高聚类稳定性和准确性;聚类后通过CH指数和分类区间占比总体两种方法,客观评价3种离散化方法,结果表明,优化的K-mean... 针对经典K均值算法在聚类中心易受异常值影响,导致聚类结果不稳定的问题,提出基于样本分布密度的优化K-means算法,以提高聚类稳定性和准确性;聚类后通过CH指数和分类区间占比总体两种方法,客观评价3种离散化方法,结果表明,优化的K-means算法避免了区间分类不合理现象,更加准确地反映了成绩样本的分布特点。 展开更多
关键词 均值算法 分布密度 聚类 k-means
下载PDF
基于融合改进K-means聚类算法的数据检测技术 被引量:1
2
作者 郭克难 《电子设计工程》 2024年第5期41-45,共5页
针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密... 针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密度和高密度距离进行计算,进而优化簇中心的选择。同时融合PCA降维算法减少了数据的冗余信息,进一步提高了运行效率。通过引入LOF离群检测算法对分簇后的数据进行检测,从而得到异常数据结果。实验测试中,所提算法在人工数据集上的平均ARI指标为0.844,真实数据集的准确率则达到了79.2%,在所有对比算法中均为最优,表明该算法具有良好的性能,可以对财务异常数据进行准确地检测。 展开更多
关键词 k-means聚类 密度峰值检测 主成分分析法 离群检测算法 异常数据检测
下载PDF
融合最近邻矩阵与局部密度的自适应K-means聚类算法 被引量:4
3
作者 艾力米努尔·库尔班 谢娟英 姚若侠 《计算机科学与探索》 CSCD 北大核心 2023年第2期355-366,共12页
针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启... 针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启发,通过引入数据对象间的距离差异值构造邻近矩阵,根据邻近矩阵计算局部密度,不需要任何参数设置,采取最近邻矩阵与局部密度融合策略,自适应确定初始聚类中心数目和位置,同时完成非中心点的初分配。人工数据集和UCI数据集的实验测试,以及与传统K-means算法、基于离群点改进的K-means算法、基于密度改进的K-means算法的实验比较表明,提出的自适应K-means算法对人工数据集的孤立点免疫度较高,对UCI数据集具有更准确的聚类结果。 展开更多
关键词 自适应k-means聚类算法 密度峰值原则 最邻近吸收原则 局部密度
下载PDF
基于全局中心的高密度不唯一的K-means算法研究 被引量:10
4
作者 何云斌 刘雪娇 +2 位作者 王知强 万静 李松 《计算机工程与应用》 CSCD 北大核心 2016年第1期48-54,共7页
传统的K-means算法敏感于初始中心点的选取,并且无法事先确定准确的聚类数目k,不利于聚类结果的稳定性。针对传统K-means算法的以上不足,提出了基于全局中心的高密度不唯一的新方法——NDK-means,该方法通过标准差确定有效密度半径,并... 传统的K-means算法敏感于初始中心点的选取,并且无法事先确定准确的聚类数目k,不利于聚类结果的稳定性。针对传统K-means算法的以上不足,提出了基于全局中心的高密度不唯一的新方法——NDK-means,该方法通过标准差确定有效密度半径,并从高密度区域中选取具有代表性的样本点作为初始聚类中心。此外算法针对最高密度点不唯一的情况进行特别分析,选取距离全局中心最远的点集作为最优的初始中心点集合。在NDK-means算法基础上结合有效性指标BWP对聚类结果进行分析,从而解决了最佳有效聚类数目无法事先确定的不足。理论研究与实验结果表明所提方法的聚类结果具有更好的稳定性和可行性。 展开更多
关键词 k-means算法 初始中心 聚类数 基于密度
下载PDF
一种基于密度的K-means算法研究 被引量:43
5
作者 张琳 陈燕 +1 位作者 汲业 张金松 《计算机应用研究》 CSCD 北大核心 2011年第11期4071-4073,4085,共4页
针对传统K-means算法必须事先确定聚类数目以及对初始聚类中心的选取比较敏感的缺陷,采用基于密度的思想,通过设定Eps邻域以及Eps邻域内至少包含的对象数minpts来排除孤立点,并将不重复的核心点作为初始聚类中心;采用类内距离和类间距... 针对传统K-means算法必须事先确定聚类数目以及对初始聚类中心的选取比较敏感的缺陷,采用基于密度的思想,通过设定Eps邻域以及Eps邻域内至少包含的对象数minpts来排除孤立点,并将不重复的核心点作为初始聚类中心;采用类内距离和类间距离的比值作为准则评价函数,将准则函数取得最小值时的聚类数作为最佳聚类数,这些改进有效地克服了K-means算法的不足。最后通过几个实例介绍了改进后算法的具体应用,实例表明改进后的算法比原算法有更高的聚类准确性,更能实现类内紧密类间远离的聚类效果。 展开更多
关键词 k-means算法 基于密度 类内距离 类间距离
下载PDF
基于平均密度优化初始聚类中心的k-means算法 被引量:32
6
作者 邢长征 谷浩 《计算机工程与应用》 CSCD 2014年第20期135-138,共4页
现有的基于密度优化初始聚类中心的k-means算法存在聚类中心的搜索范围大、消耗时间久以及聚类结果对孤立点敏感等问题,针对这些问题,提出了一种基于平均密度优化初始聚类中心的k-means算法adk-means。该算法将数据集中的孤立点划分出来... 现有的基于密度优化初始聚类中心的k-means算法存在聚类中心的搜索范围大、消耗时间久以及聚类结果对孤立点敏感等问题,针对这些问题,提出了一种基于平均密度优化初始聚类中心的k-means算法adk-means。该算法将数据集中的孤立点划分出来,计算出剩余数据集样本的平均密度,孤立点不参与聚类过程中各类所含样本均值的计算;在大于平均密度的密度参数集合中选择聚类中心,根据最小距离原则将孤立点分配给离它最近的聚类中心,直至将数据集完整分类。实验结果表明,这种基于平均密度优化初始聚类中心的k-means算法比现有的基于密度的k-means算法有更快的收敛速度,更强的稳定性及更高的聚类精度,消除了聚类结果对孤立点的敏感性。 展开更多
关键词 k-means算法 聚类中心 平均密度 孤立点 收敛
下载PDF
密度K-means算法在认知重评脑功能连接中的应用 被引量:3
7
作者 邹凌 徐逸 周仁来 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第5期841-846,共6页
为考察大脑在处理加工不同效价的情绪图片时其脑功能区域的联系与差异,提出一种能更精确地提取出相对激活较弱的功能连接区域的方法.首先提出一种基于密度思想的K-means算法并应用于脑功能连接分析,提取具有功能连接的脑组织结构模式;... 为考察大脑在处理加工不同效价的情绪图片时其脑功能区域的联系与差异,提出一种能更精确地提取出相对激活较弱的功能连接区域的方法.首先提出一种基于密度思想的K-means算法并应用于脑功能连接分析,提取具有功能连接的脑组织结构模式;然后引入聚合指数指标客观评判激活脑区定位的准确度,并与独立成分分析方法的处理结果进行对比;最后从体素的激活强度和激活脑区的定位精度等方面入手,论证了基于密度思想的K-means算法在脑功能连接分析上的优势.实验结果表明,情绪刺激加工的过程中,脑区较为明显的激活区主要分布在前额叶、扣带回及下丘脑附近,为后续临床观察及诊断提供了一种较为可靠的方法和思路. 展开更多
关键词 功能连接 认知重评 密度k-means算法 独立成分分析
下载PDF
基于全局K-means算法的高校学生成绩分析 被引量:5
8
作者 谷欣超 徐福祥 +1 位作者 杨勇 曲福恒 《长春理工大学学报(自然科学版)》 2019年第5期93-97,共5页
采用无监督聚类算法实现对学生成绩的评价分析。在给定的聚类个数区间内,全局K-means聚类算法对学生成绩数据进行聚类,得到不同聚类个数下的成绩分类结果;结合聚类有效性指标自动地确定出最佳聚类数目,实现对学生多科成绩数据的无监督... 采用无监督聚类算法实现对学生成绩的评价分析。在给定的聚类个数区间内,全局K-means聚类算法对学生成绩数据进行聚类,得到不同聚类个数下的成绩分类结果;结合聚类有效性指标自动地确定出最佳聚类数目,实现对学生多科成绩数据的无监督分类。实验结果表明,本方法能够发现不同成绩聚类结果之间的差异,揭示影响数据分布的主要因素,平衡了数据的所有属性对最终的分析结果的影响,同时避免了手动分析中结果容易产生较大偏差的问题。对指导学生选修课程、教师对个人的教学方法进行调整以及改善学校教学质量和提升学生成绩都具有重要作用。 展开更多
关键词 聚类分析 k-means算法 全局k-means 成绩分析
下载PDF
密度峰值优化初始中心的K-means算法 被引量:7
9
作者 李敏 张桂珠 《计算机应用与软件》 2017年第3期212-217,共6页
K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定。为此,提出一种快速密度峰值搜索算法CFSFDP(clustering by fast search and find of density peaks)优化初始中心的K-means算法。首先针对CFSFDP算法中截断距离的选取影响局... K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定。为此,提出一种快速密度峰值搜索算法CFSFDP(clustering by fast search and find of density peaks)优化初始中心的K-means算法。首先针对CFSFDP算法中截断距离的选取影响局部密度的计算这一缺点,提出用动力学中的势能替换数据点的局部密度;在此基础上,利用改进的CFSFDP算法选取初始聚类中心,实现K-means聚类。在UCI数据集和人工模拟数据集上的测试结果表明,优化后的新算法具有更好的聚类结果。 展开更多
关键词 k-means算法CFSFDP算法 密度峰值 引力势能
下载PDF
基于全局K-means算法的超像素分割方法 被引量:9
10
作者 吉长东 李相泽 敖国政 《沈阳大学学报(自然科学版)》 CAS 2017年第3期212-216,共5页
为了提高超像素分割的性能,提出了一种基于全局K-means算法的超像素分割方法。该算法利用全局K-means算法计算超像素聚类,优化了超像素的分割质量,并根据聚类后的超像素结果从图像中分割出目标.实验数据来自于国际公认的PASCAL VOC 200... 为了提高超像素分割的性能,提出了一种基于全局K-means算法的超像素分割方法。该算法利用全局K-means算法计算超像素聚类,优化了超像素的分割质量,并根据聚类后的超像素结果从图像中分割出目标.实验数据来自于国际公认的PASCAL VOC 2007数据集.实验结果表明,与Wang算法和ISLIC算法相比,提出的分割算法的PRI、CR、VOI及运行时间4个指标分别平均提高9.38%、17.13%、21.67%、10.50%,可以实现更佳的图像分割效果. 展开更多
关键词 图像分割 超像素 全局k-means算法 聚类
下载PDF
基于加权密度Canopy的K-means文本聚类 被引量:1
11
作者 宋健 李岩芳 陈占芳 《中南民族大学学报(自然科学版)》 CAS 北大核心 2023年第5期636-642,共7页
针对现有文本聚类性能不高的问题,提出了一种改进质心初始化的K-means文本聚类算法.该算法首先利用Canopy算法进行文本预聚类,并且对Canopy算法的阈值选取策略进行改进,定义加权密度进行Canopy中心的选取,得到更准确的聚类数以及初始聚... 针对现有文本聚类性能不高的问题,提出了一种改进质心初始化的K-means文本聚类算法.该算法首先利用Canopy算法进行文本预聚类,并且对Canopy算法的阈值选取策略进行改进,定义加权密度进行Canopy中心的选取,得到更准确的聚类数以及初始聚类中心;然后将所得结果作为K-means算法的初始化参数进行后续迭代聚类,有效解决了传统算法因随机选取初始聚类中心而陷入局部最优解的问题,减少了算法的迭代次数,提高了聚类准确性.实验结果表明:与其他同类型算法相比,该算法在文本聚类分析中更具优势. 展开更多
关键词 文本聚类 k-means算法 加权密度 Canopy算法
下载PDF
一种融合K-means和快速密度峰值搜索算法的聚类方法 被引量:13
12
作者 盛华 张桂珠 《计算机应用与软件》 CSCD 2016年第10期260-264,269,共6页
K-means算法的初始聚类中心是随机选取的,不同的初始中心输入会得出不同的聚类结果。针对K-means算法存在的问题,提出一种融合K-means算法与聚类的快速搜索和发现密度峰算法的聚类算法(K-CBFSAFODP)。该算法是这样考虑的:类簇中心被具... K-means算法的初始聚类中心是随机选取的,不同的初始中心输入会得出不同的聚类结果。针对K-means算法存在的问题,提出一种融合K-means算法与聚类的快速搜索和发现密度峰算法的聚类算法(K-CBFSAFODP)。该算法是这样考虑的:类簇中心被具有较低局部密度的邻居点包围,且与具有更高密度的任何点都有相对较大的距离,以此来刻画聚类中心;再运用K-means算法进行迭代聚类,弥补了K-means聚类中心随机选取导致容易陷入局部最优的缺点;并且引入了熵值法用来计算距离,从而实现优化聚类。在UCI数据集和人工模拟数据集上的实验表明,融合算法不仅能得到较好的聚类结果,而且聚类很稳定,同时也有较快的收敛速度,证实了该融合算法的可行性。 展开更多
关键词 聚类 k-means算法 CBFSAFODP算法 初始聚类中心 密度 信息熵
下载PDF
基于密度的K-means初始聚类中心选取算法 被引量:8
13
作者 韩凌波 《电子科技》 2015年第7期105-107,共3页
传统K-means算法的初始聚类中心从数据集中随机抽取,聚类结果会随着初始聚类中心的不同而产生波动。针对这一问题,提出一种基于密度的优化初始聚类中心选取算法,通过计算每个数据对象的密度参数和邻域距离,选取k个处于高密度分布的点作... 传统K-means算法的初始聚类中心从数据集中随机抽取,聚类结果会随着初始聚类中心的不同而产生波动。针对这一问题,提出一种基于密度的优化初始聚类中心选取算法,通过计算每个数据对象的密度参数和邻域距离,选取k个处于高密度分布的点作为初始聚类中心。在聚类类别数给定的情况下,使用标准的UCI数据库进行对比实验,发现改进后的算法较传统算法有相对较高的准确率和稳定性。 展开更多
关键词 k-means算法 聚类中心 密度参数 邻域距离
下载PDF
基于改进K-means算法的网络攻击入侵检测方法设计 被引量:2
14
作者 吴瑕 狄宏林 周勇 《佳木斯大学学报(自然科学版)》 CAS 2023年第6期44-47,94,共5页
为保障计算机的网络安全,增强其对于外来入侵数据进行准确检测的能力,此次研究利用峰值密度对于传统K-means算法进行了改进并将改进后的算法应用到网络入侵检测模型当中。在两个入侵数据集下,利用检测率、误报率、准确率和检测时间四个... 为保障计算机的网络安全,增强其对于外来入侵数据进行准确检测的能力,此次研究利用峰值密度对于传统K-means算法进行了改进并将改进后的算法应用到网络入侵检测模型当中。在两个入侵数据集下,利用检测率、误报率、准确率和检测时间四个指标对算法进行测试,发现改进算法的检测率在94%~99%之间,误报率在0.1%~0.8%之间,准确率最大值为99.5%,检测所花费的时间也远小于传统算法。综上,将改进后的算法应用到网络入侵检测模型中能够获得更好的入侵检测效果,从而保障计算机的安全。 展开更多
关键词 k-means 网络入侵 检测算法 峰值密度
下载PDF
引入全局算法的小批量K-Means
15
作者 王颖 吴观茂 《牡丹江师范学院学报(自然科学版)》 2020年第2期18-21,共4页
提出一种引入全局算法的小批量K-means.算法应用全局搜索算法,解决在大数据情况下运算耗时问题和传统K-means对初始中心点敏感的问题.实验结果表明,该方法在获得最佳结果的前提下可以节省大量的计算时间.
关键词 数据挖掘 全局搜索 k-means算法 小批量
下载PDF
优化的K-means聚类算法在客户细分中的应用研究 被引量:2
16
作者 唐欣 《智能计算机与应用》 2023年第9期194-196,F0003,共4页
传统的K-means聚类算法虽然操作简单快捷,但因随机选取聚类中心等问题容易陷入局部最优,导致算法不稳定。本文从样本间的关系出发,利用样本密度来优化K-means算法,并利用聚类有效性指标进行比较,优化后的K-means算法更具有稳定性且聚类... 传统的K-means聚类算法虽然操作简单快捷,但因随机选取聚类中心等问题容易陷入局部最优,导致算法不稳定。本文从样本间的关系出发,利用样本密度来优化K-means算法,并利用聚类有效性指标进行比较,优化后的K-means算法更具有稳定性且聚类准确率更高。最后,将该算法应用到客户细分RFM模型中,依据聚类结果找到适合不同消费者的营销策略,从而帮助企业更好地为其提供差异化、个性化服务。 展开更多
关键词 k-means算法 样本密度 客户细分 RFM模型
下载PDF
基于密度的K-means聚类算法改进研究
17
作者 许玲 《滁州学院学报》 2020年第5期48-51,共4页
传统的K-means算法按照最小距离原则,将数据样本划分到距离最近的聚类中心所在的簇中。如果距离的最小值与次小值近似,显然这样直接划分不合理。针对此问题,本文引入密度极小值理论。将这些特殊的数据样本划分到最小密度距离所对应的簇... 传统的K-means算法按照最小距离原则,将数据样本划分到距离最近的聚类中心所在的簇中。如果距离的最小值与次小值近似,显然这样直接划分不合理。针对此问题,本文引入密度极小值理论。将这些特殊的数据样本划分到最小密度距离所对应的簇中,使邻近数据更紧凑。实验结果表明,本文算法有效的提高聚类准确度、精确度,得到良好的聚类效果。 展开更多
关键词 k-means算法 密度参数 准确度
下载PDF
基于全局性分裂算子的进化K-means算法 被引量:3
18
作者 王留正 何振峰 《计算机应用》 CSCD 北大核心 2012年第11期3005-3008,共4页
进化算法可以有效地克服K-means对初始聚类中心敏感的缺陷,提高了聚类性能。在进化K-means聚类算法(F-EAC)的基础上,针对其变异操作——簇分裂算子的随机性与局部性,提出了两个全局性分裂算子。结合最大最小距离的思想,利用待分裂簇的... 进化算法可以有效地克服K-means对初始聚类中心敏感的缺陷,提高了聚类性能。在进化K-means聚类算法(F-EAC)的基础上,针对其变异操作——簇分裂算子的随机性与局部性,提出了两个全局性分裂算子。结合最大最小距离的思想,利用待分裂簇的周边簇信息来指导簇分裂初始点的选择,使簇的分裂更有利于全局划分,以进一步提高进化聚类的有效性。实验结果表明,基于全局性分裂算子的算法在类数发现及聚类精度方面均优于F-EAC。 展开更多
关键词 k-means 进化算法 变异算子 全局分裂 最大最小距离
下载PDF
基于密度优化初始聚类中心的K-means算法 被引量:6
19
作者 王艳娥 安健 +1 位作者 梁艳 康晶晶 《计算机技术与发展》 2020年第12期99-105,共7页
针对K-means算法随机选择初始聚类中心,对噪音和异常点比较敏感,聚类结果过多依赖于专家经验从而缺乏一定客观性的问题,提出一种新的度量样本密度的方法优化K-means算法对初始聚类中心的选择。该方法基于样本实际分布,以最优超球体中样... 针对K-means算法随机选择初始聚类中心,对噪音和异常点比较敏感,聚类结果过多依赖于专家经验从而缺乏一定客观性的问题,提出一种新的度量样本密度的方法优化K-means算法对初始聚类中心的选择。该方法基于样本实际分布,以最优超球体中样本个数与超球体中样本相似性作为度量样本密度的关键,能够有效选出较优的聚类中心,使得选择的初始聚类中心更接近样本集的实际分布。算法在乳腺癌数据集、常用UCI数据集以及人工模拟数据集上进行测试,实验结果表明,与已有同类方法相比,该算法在各数据集上的聚类评价指标均有提高,而且运行速度更快,聚类结果更稳定,聚类准确率更高:在乳腺癌数据集wdbc上的准确率为91.04%,提高了6%。在Iris数据集上的准确率为94%,提高了5%。 展开更多
关键词 k-means算法 密度 去噪 最优超球体 均方差 噪声数据
下载PDF
一种基于密度峰和k-means算法的图像分割算法 被引量:5
20
作者 刘海谊 赵汝文 丁勇 《桂林电子科技大学学报》 2018年第5期385-388,共4页
针对传统的k-means算法应用在图像分割时需要手动调试参数的缺点,提出了一种将密度峰算法、最近邻插值算法和k-means聚类算法相结合的图像分割算法。用最近邻插值算法缩小原图像像素点,用密度峰算法提取图像的中心点,并将该中心点作为k-... 针对传统的k-means算法应用在图像分割时需要手动调试参数的缺点,提出了一种将密度峰算法、最近邻插值算法和k-means聚类算法相结合的图像分割算法。用最近邻插值算法缩小原图像像素点,用密度峰算法提取图像的中心点,并将该中心点作为k-means的初始聚类中心,用k-means算法对原始图像进行图像分割。实验结果表明,改进算法拥有更强的自适应性和鲁棒性。 展开更多
关键词 k-means算法 密度算法 图像分割
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部