期刊文献+
共找到712篇文章
< 1 2 36 >
每页显示 20 50 100
基于马氏距离和Canopy改进K-means的交通聚类算法
1
作者 徐文进 马越 杜咏慧 《计算机与数字工程》 2024年第6期1630-1635,1649,共7页
在对交通数据的研究中经常会使用到聚类算法,且不同的聚类算法有不同的特性。K-means作为其中的一种聚类算法,具有较高的准确性和实用性,但其准确性易受主观选取K值和确定初始聚类中心的影响。为了优化聚类中心和K值的选取问题,提出MC-K... 在对交通数据的研究中经常会使用到聚类算法,且不同的聚类算法有不同的特性。K-means作为其中的一种聚类算法,具有较高的准确性和实用性,但其准确性易受主观选取K值和确定初始聚类中心的影响。为了优化聚类中心和K值的选取问题,提出MC-Kmeans算法。在所提方法中,首先通过Canopy算法选取K值,然后依据马氏距离的计算准则来确定初始聚类中心,最后将K值和聚类中心的值作为K-means的参数进行聚类。将MC-Kmeans算法应用到某时间段的纽约出租车交通数据中进行实际的验证。结果表明,与K-means算法比较,所提方法准确度更高,与实际交通情况更加相匹配,更能反映区域内的交通热点情况。 展开更多
关键词 K-means Canopy算法 马氏距离 交通
下载PDF
基于自适应布谷鸟优化特征选择的K-means聚类 被引量:3
2
作者 孙林 刘梦含 《计算机应用》 CSCD 北大核心 2024年第3期831-841,共11页
K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首... K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首先,为提升CS算法的搜索速度和精度,在莱维飞行阶段,设计了自适应步长因子;为调节CS算法全局搜索和局部搜索之间的平衡、加快CS算法的收敛,动态调整发现概率,进而提出改进的动态CS算法(IDCS),在IDCS的基础上构建了结合动态CS的特征选择算法(DCFS)。其次,为提升传统欧氏距离的计算精确度,设计同时考虑样本和特征对距离计算贡献程度的加权欧氏距离;为了确定最佳聚类数目的选取方法,依据改进的加权欧氏距离构造了加权簇内距离和簇间距离。最后,为克服传统K-means聚类目标函数仅考虑簇内的距离而未考虑簇间距离的缺陷,提出基于中位数的轮廓系数的目标函数,进而设计了DCFSK。实验结果表明,在10个基准测试函数上,IDCS的各项指标取得了较优的结果;相较于K-means、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)等算法,在6个合成数据集与6个UCI数据集上,DCFSK的聚类效果最佳。 展开更多
关键词 布谷鸟搜索算法 K-means聚类 欧氏距离 特征选择 轮廓系数
下载PDF
基于K-means物流配送中心选址模型
3
作者 李川 刘洲洲 李美蓉 《计算机与数字工程》 2024年第9期2810-2813,2830,共5页
针对当前物流配送成本高、效率低、城市物流配送中心选址不合理等问题,在分析国内外物流配送中心选址的基础上,通过对物流配送中心选址的影响因素进行研究,采用计算多维欧几里得距离,构建基于K-means算法的物流配送中心选址模型,该模型... 针对当前物流配送成本高、效率低、城市物流配送中心选址不合理等问题,在分析国内外物流配送中心选址的基础上,通过对物流配送中心选址的影响因素进行研究,采用计算多维欧几里得距离,构建基于K-means算法的物流配送中心选址模型,该模型根据收货点与各配送中心的欧几里得距离最小值进行聚类,以确定物流配送中心的位置及其所覆盖的收货点,该模型为国内物流公司调整或新增物流配送中心提供了一个解决方案。通过应用实验,验证了模型合理性及有效性,并分析研究中的不足和进一步研究方向。 展开更多
关键词 欧几里得距离 K-means 物流配送中心 选址
下载PDF
基于改进粒子群和K-means聚类的优化算法 被引量:4
4
作者 孙林 张一曼 +1 位作者 张辰珂 徐久成 《江苏科技大学学报(自然科学版)》 CAS 北大核心 2023年第3期81-90,共10页
为了解决粒子群优化(particle swarm optimization, PSO)收敛速度慢和迭代次数多,以及传统K-means聚类算法采取的欧氏距离划分准则会导致聚类效果不理想等问题,构建了基于改进粒子群和K-means聚类的优化算法.根据Sigmoid函数优势,对PSO... 为了解决粒子群优化(particle swarm optimization, PSO)收敛速度慢和迭代次数多,以及传统K-means聚类算法采取的欧氏距离划分准则会导致聚类效果不理想等问题,构建了基于改进粒子群和K-means聚类的优化算法.根据Sigmoid函数优势,对PSO算法中速度更新公式的惯性权重参数实施改进,得到新的惯性权重公式,有效提高PSO算法的收敛速度;在PSO算法的位置更新公式中引入时间权重,通过调整时间权重大小,控制粒子的空间搜索范围,增强粒子的搜索能力;在传统的欧氏距离中引入属性权值,得到新的欧氏距离计算公式,该公式在计算两个向量相似度时,同时考虑了两个向量间的累积差异以及它们之间的相似性,与改进的PSO算法相结合,设计了基于改进粒子群和K-means聚类的优化算法.在6个基准测试函数和13个UCI数据集上,将所提出的优化算法与其他算法进行对比实验分析.实验结果表明:所提算法在收敛速度和寻优稳定性方面得到了明显提升,有效地提高了聚类准确率并且降低了迭代次数. 展开更多
关键词 粒子群优化 K-means聚类 惯性权重 时间权重 欧氏距离
下载PDF
基于K-means聚类的舰船通信网络异常数据检测 被引量:2
5
作者 徐胤博 于洋 《舰船科学技术》 北大核心 2023年第16期169-172,共4页
为了解决海上通信环境中的干扰和传输问题,提升舰船通信网络通信质量和可靠性,提出基于K-means聚类的舰船通信网络异常数据检测方法。构建舰船通信网络通信多径信道模型,利用该模型获取舰船通信网络数据。使用基于超窄带滤波的舰船通信... 为了解决海上通信环境中的干扰和传输问题,提升舰船通信网络通信质量和可靠性,提出基于K-means聚类的舰船通信网络异常数据检测方法。构建舰船通信网络通信多径信道模型,利用该模型获取舰船通信网络数据。使用基于超窄带滤波的舰船通信网络数据滤波处理方法去除舰船通信网络数据内的干扰噪声,将无噪声的舰船通信网络数据作为输入,使用K-means聚类算法输出舰船通信网络异常数据检测结果。结果表明,该方法采集舰船通信网络数据较为准确,并可有效去除数据内含有的干扰噪声,降低舰船通信网络数据幅值区间,同时可用聚类方式准确检测舰船通信网络异常数据,应用效果较为显著。 展开更多
关键词 K-means聚类 舰船通信网络 异常数据检测 马氏距离 超窄带滤波
下载PDF
基于K-means聚类的城市生活用水水质异常特征检测算法 被引量:2
6
作者 黄小英 《化工设计通讯》 CAS 2023年第6期164-166,共3页
为解决水质异常特征检测中存在检测精度低等问题,提出基于K-means聚类的城市生活用水水质异常特征检测算法。首先,通过构建水质特征提取系统,并通过荧光法计算污染物含量,完成水质特征提取及污染物质含量确定。再将城市生活用水水质pH... 为解决水质异常特征检测中存在检测精度低等问题,提出基于K-means聚类的城市生活用水水质异常特征检测算法。首先,通过构建水质特征提取系统,并通过荧光法计算污染物含量,完成水质特征提取及污染物质含量确定。再将城市生活用水水质pH、氨氮、耗氧量、色度以及浑浊度作为异常值,通过K-means聚类计算数据间信任度及数据簇距离,并构建城市生活用水水质异常特征检测模型,完成检测。结果表明:采用所提方法检测城市生活用水水质异常特征的精度较高。 展开更多
关键词 K-means聚类 城市生活用水 水质异常特征 信任度 簇距离
下载PDF
基于改进K-means聚类的配电网工程数据预处理算法设计 被引量:4
7
作者 田海丰 任惠瑞 +2 位作者 华生萍 才海多杰 张强 《电子设计工程》 2023年第12期137-141,共5页
针对传统配电网工程数据的预处理方法较为依赖电力工程师专业知识,工作效率低且难以保证准确率等问题,提出了基于改进K-means聚类的配电网工程数据预处理算法。该算法通过对原始数据进行标准化处理来消除量纲对数据的影响,采用改进K-me... 针对传统配电网工程数据的预处理方法较为依赖电力工程师专业知识,工作效率低且难以保证准确率等问题,提出了基于改进K-means聚类的配电网工程数据预处理算法。该算法通过对原始数据进行标准化处理来消除量纲对数据的影响,采用改进K-means算法对处理后的数据实现聚类分析。同时根据计算相似性的方式优化聚类结果,并利用线性回归分析对聚类结果加以处理得到最终结果。实验结果说明,文中方法对配电网工程数据的测算误差低于8.01%,相较于传统对照组方法具有显著优势。利用该文所提算法对配电网工程的各类相关数据进行深入的挖掘分析,能够为电力工程的精准推进提供有效的数据支撑。 展开更多
关键词 K-means聚类 数据标准化 线性回归 欧氏距离 配电网工程数据
下载PDF
基于汉明距离的量子K-Means算法 被引量:1
8
作者 钟静 林晨 +1 位作者 盛志伟 张仕斌 《计算机应用》 CSCD 北大核心 2023年第8期2493-2498,共6页
K-Means算法在处理大规模异构数据时,通常使用欧氏距离来衡量数据点之间的相似度,然而这样存在效率低下以及计算复杂性过高的问题。受到汉明距离在处理数据相似性计算上存在显著优势的启发,提出一种基于汉明距离的量子K-Means(QKMH)算... K-Means算法在处理大规模异构数据时,通常使用欧氏距离来衡量数据点之间的相似度,然而这样存在效率低下以及计算复杂性过高的问题。受到汉明距离在处理数据相似性计算上存在显著优势的启发,提出一种基于汉明距离的量子K-Means(QKMH)算法来计算相似度。首先,将数据制备成量子态,并使用量子汉明距离计算待聚类点和K个聚类中心之间的相似度;然后,改进了Grover最小值搜索算法查找距离待聚类点最近的聚类中心;最后,循环以上步骤,直到达到规定迭代次数或者聚类中心不再改变。基于量子模拟计算框架QisKit,将提出的算法在MNIST手写数字数据集上进行了验证并与传统和改进的多种方法进行了对比,实验结果表明,QKMH算法的F1值相较于基于曼哈顿距离的量子K-Means算法提高了10个百分点,相较于最新优化的基于欧氏距离的量子K-Means算法提高了4.6个百分点;同时经计算,QKMH算法时间复杂度比上述对比算法更低。 展开更多
关键词 量子机器学习 量子算法 量子K-means算法 汉明距离 Grover搜索算法
下载PDF
基于初始质心的K-Means算法优化 被引量:1
9
作者 何嘉伦 马冲 《长江信息通信》 2023年第6期69-72,75,共5页
由于传统K-Means聚类算法对初始质心的赋值具有随机性,使得模拟结果有着极大的波动。针对这一问题,文章采用均分法,首先将样本数据清洗,将偏差值较大的数据筛除,然后把处理后的样本数据在二维平面内均匀划分成若干等分,进行排序归纳计... 由于传统K-Means聚类算法对初始质心的赋值具有随机性,使得模拟结果有着极大的波动。针对这一问题,文章采用均分法,首先将样本数据清洗,将偏差值较大的数据筛除,然后把处理后的样本数据在二维平面内均匀划分成若干等分,进行排序归纳计算出最佳初始质心用于聚类算法的初次迭代,并调用SSE等度量指标对迭代的质心进行更新,最后将样本数据划分成有意义的簇。实验结果表明,文章针对K-Means算法的优化在一定程度上减少了质心的迭代次数,节省了时间同时提高了准确率,对初始质心赋值优化具有有效性和实用性的特点。 展开更多
关键词 K-means算法 欧氏距离 SSE 轮廓系数 方差比准则 DB
下载PDF
基于改进K-means算法的冬小麦覆盖度提取研究
10
作者 赵文昊 姬江涛 +3 位作者 马淏 金鑫 李雪 马海港 《中国农业科技导报》 CAS CSCD 北大核心 2023年第1期83-91,共9页
为快速、精准地提取冬前分蘖期冬小麦覆盖度,提出了一种基于改进K-means算法的冬小麦覆盖度提取方法。首先将冬小麦图像转换到Lab色彩空间,其次利用蜉蝣算法(Mayfly Algorithm, MA)获取K-means最优初始聚类中心,并用马氏距离代替欧氏距... 为快速、精准地提取冬前分蘖期冬小麦覆盖度,提出了一种基于改进K-means算法的冬小麦覆盖度提取方法。首先将冬小麦图像转换到Lab色彩空间,其次利用蜉蝣算法(Mayfly Algorithm, MA)获取K-means最优初始聚类中心,并用马氏距离代替欧氏距离进行算法改进,最后利用分割得到的二值图像计算冬小麦覆盖度。结果显示,该方法的平均分割精度和平均处理时间分别为94.66%和2.03 s,与过绿指数(excess green,EXG)自适应阈值分割和基于粒子群优化算法(particle swarm optimization,PSO)的K-means(PSO-K-means)分割相比,分割精度分别提高了12.04%和4.18%,处理时间分别减少了2.26和2.94 s。该方法分割效果优于EXG和PSO-K-means分割方法,可用于提取冬小麦覆盖度。 展开更多
关键词 冬小麦覆盖度 改进K-means算法 Lab色彩空间 蜉蝣算法 马氏距离
下载PDF
最大距离法选取初始簇中心的K-means文本聚类算法的研究 被引量:108
11
作者 翟东海 鱼江 +2 位作者 高飞 于磊 丁锋 《计算机应用研究》 CSCD 北大核心 2014年第3期713-715,719,共4页
由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选取初始簇中心的Kmeans文本聚类算法。该算法基于这样的事实... 由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选取初始簇中心的Kmeans文本聚类算法。该算法基于这样的事实:距离最远的样本点最不可能分到同一个簇中。为使该算法能应用于文本聚类,构造了一种将文本相似度转换为文本距离的方法,同时也重新构造了迭代中的簇中心计算公式和测度函数。在实例验证中,对分属于五个类别的1 500篇文本组成的文本集进行了文本聚类分析,其结果表明,与原始的K-means聚类算法以及其他的两种改进的K-means聚类算法相比,新提出的文本聚类算法在降低了聚类总耗时的同时,F度量值也有了明显提高。 展开更多
关键词 K-means聚类算法 最大距离 文本聚类 文本距离 测度函数 F度量值
下载PDF
一种基于密度的K-means算法研究 被引量:43
12
作者 张琳 陈燕 +1 位作者 汲业 张金松 《计算机应用研究》 CSCD 北大核心 2011年第11期4071-4073,4085,共4页
针对传统K-means算法必须事先确定聚类数目以及对初始聚类中心的选取比较敏感的缺陷,采用基于密度的思想,通过设定Eps邻域以及Eps邻域内至少包含的对象数minpts来排除孤立点,并将不重复的核心点作为初始聚类中心;采用类内距离和类间距... 针对传统K-means算法必须事先确定聚类数目以及对初始聚类中心的选取比较敏感的缺陷,采用基于密度的思想,通过设定Eps邻域以及Eps邻域内至少包含的对象数minpts来排除孤立点,并将不重复的核心点作为初始聚类中心;采用类内距离和类间距离的比值作为准则评价函数,将准则函数取得最小值时的聚类数作为最佳聚类数,这些改进有效地克服了K-means算法的不足。最后通过几个实例介绍了改进后算法的具体应用,实例表明改进后的算法比原算法有更高的聚类准确性,更能实现类内紧密类间远离的聚类效果。 展开更多
关键词 K-means算法 基于密度 类内距离 类间距离
下载PDF
一种有效的K-means聚类中心初始化方法 被引量:86
13
作者 熊忠阳 陈若田 张玉芳 《计算机应用研究》 CSCD 北大核心 2011年第11期4188-4190,共3页
传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上... 传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上,选取到所有已初始化聚类中心距离乘积最大的高密度点作为当前聚类中心。理论分析与对比实验结果表明,此方法相对于传统K-means算法和最大最小距离法有更快的收敛速度、更高的准确率和更强的稳定性。 展开更多
关键词 K-均值算法 基于密度 初始聚类中心 最大最小距离 最大距离积
下载PDF
优化初始聚类中心的改进K-means算法 被引量:33
14
作者 唐东凯 王红梅 +1 位作者 胡明 刘钢 《小型微型计算机系统》 CSCD 北大核心 2018年第8期1819-1823,共5页
针对K-means算法对初始聚类中心和离群点敏感的缺点,提出了一种优化初始聚类中心的改进K-means算法.该算法首先计算出数据集中每个数据对象的离群因子,并根据离群因子的值对数据集进行升序排列,使得中心点的位置靠前.然后在升序排列的... 针对K-means算法对初始聚类中心和离群点敏感的缺点,提出了一种优化初始聚类中心的改进K-means算法.该算法首先计算出数据集中每个数据对象的离群因子,并根据离群因子的值对数据集进行升序排列,使得中心点的位置靠前.然后在升序排列的数据集上,引入取样因子α,得到候选初始中心点集.最后,根据最大最小距离的思想,在候选初始中心点集上选取k个数据对象作为初始聚类中心.实验结果表明,在时间基本相同的情况下,提出的改进算法相对K-means、K-means++算法具有较好的稳定性和较高的聚类准确率,并且聚类的平均迭代次数也相对较小. 展开更多
关键词 K-means算法 初始聚类中心 离群因子 取样因子 最大最小距离
下载PDF
基于模糊粒度计算的K-means文本聚类算法研究 被引量:12
15
作者 张霞 王素贞 +1 位作者 尹怡欣 赵海龙 《计算机科学》 CSCD 北大核心 2010年第2期209-211,共3页
传统的K-means算法对初始聚类中心非常敏感,聚类结果随不同的初始输入而波动,算法的稳定性下降。针对这个问题,提出了一种优化初始聚类中心的新算法:在数据对象的模糊粒度空间上给定一个归一化的距离函数,用此函数对所有距离小于粒度d_... 传统的K-means算法对初始聚类中心非常敏感,聚类结果随不同的初始输入而波动,算法的稳定性下降。针对这个问题,提出了一种优化初始聚类中心的新算法:在数据对象的模糊粒度空间上给定一个归一化的距离函数,用此函数对所有距离小于粒度d_λ的数据对象进行初始聚类,对初始聚类簇计算其中心,得到一组优化的聚类初始值。实验对比证明,新算法有效地消除了传统K-means算法对初始输入的敏感性,提高了算法的稳定性和准确率。 展开更多
关键词 模糊 粒度 K-means 文本聚类 归一化距离函数
下载PDF
基于形状相似距离的K-means聚类算法 被引量:8
16
作者 苑津莎 李中 《华北电力大学学报(自然科学版)》 CAS 北大核心 2009年第6期98-103,共6页
把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基... 把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基于形状相似距离的K-means算法比采用传统距离的K-means算法,聚类准确度显著提高。 展开更多
关键词 聚类 K—means算法 相似度 距离 形状
下载PDF
基于改进K-means聚类和SBR算法的风电场景缩减方法研究 被引量:37
17
作者 赵书强 要金铭 李志伟 《电网技术》 EI CSCD 北大核心 2021年第10期3947-3954,共8页
场景法是适应风电高占比电力系统优化调度的重要方法。作为场景分析方法的研究热点,场景缩减的意义在于用少量代表性场景描述大量复杂性场景特征,达到降低计算复杂度的目的。针对风电出力提出一种基于改进的K-means聚类和同步回代消除算... 场景法是适应风电高占比电力系统优化调度的重要方法。作为场景分析方法的研究热点,场景缩减的意义在于用少量代表性场景描述大量复杂性场景特征,达到降低计算复杂度的目的。针对风电出力提出一种基于改进的K-means聚类和同步回代消除算法(simultaneous backward reduction,SBR)相结合的场景缩减方法。首先基于改进的K-means聚类算法对原始场景进行快速分类,其次针对每一类簇中的场景集合采用基于Kantorovich距离的SBR算法进行缩减。该方法可以在保证计算精度的同时,提高规模较大场景集合缩减的计算效率。最后采用我国西北某省网风功率实际数据开展实证分析,通过布莱尔分数(Brier score,BS)指标和风功率波动的高斯混合模型验证了所提场景缩减方法的有效性和优越性。 展开更多
关键词 K-means聚类 Kantorovich距离 同步回代消除算法 BS指标
下载PDF
基于距离阈值及样本加权的K-means聚类算法 被引量:8
18
作者 安计勇 闫子骥 翟靖轩 《微电子学与计算机》 CSCD 北大核心 2015年第8期135-138,共4页
提出了一种基于距离阈值及样本加权的K-means聚类算法.该算法首先采用样本集的样本均值作为第一个初始族中心;其次基于距离阈值的方法动态确定初始族中心及个数;最后基于样本加权的方法来降低离散点对聚类效果的影响,使带权值的样本点... 提出了一种基于距离阈值及样本加权的K-means聚类算法.该算法首先采用样本集的样本均值作为第一个初始族中心;其次基于距离阈值的方法动态确定初始族中心及个数;最后基于样本加权的方法来降低离散点对聚类效果的影响,使带权值的样本点参与整个聚类过程,采用轮廓系数来衡量不同算法的聚类质量.实验结果表明:相比于原始的K-means聚类算法和文献[1]中算法,所提出的算法具有更好的聚类质量. 展开更多
关键词 距离阈值 样本加权 K-means 轮廓系数
下载PDF
基于改进流形距离的粗糙集k-means聚类算法 被引量:4
19
作者 欧慧 夏卓群 武志伟 《计算机工程与应用》 CSCD 北大核心 2016年第14期84-89,共6页
针对现有的基于流形距离的聚类算法对"绝对流形"数据集较"相对流形"数据集聚类效果佳和参数ρ在较大范围内变化时,聚类性能较差等问题,提出基于改进流形距离的粗糙集k-means聚类算法。该算法通过用属性划分和最大... 针对现有的基于流形距离的聚类算法对"绝对流形"数据集较"相对流形"数据集聚类效果佳和参数ρ在较大范围内变化时,聚类性能较差等问题,提出基于改进流形距离的粗糙集k-means聚类算法。该算法通过用属性划分和最大最小距离选择初始聚类中心,以改进的流形距离和粗糙集优化k-means,并结合终止判断条件以达到解决边界数据聚类问题和提升聚类效果的目的。仿真结果表明:该算法对"绝对流形"和"相对流形"数据集聚类效果均有较好改善,且参数变化对聚类性能影响较大。 展开更多
关键词 K-means算法 最大最小距离 改进流形距离 粗糙集 适应度函数
下载PDF
融入密度和距离的K-means初始簇中心优选方法研究 被引量:5
20
作者 冯勇 张学理 +1 位作者 王嵘冰 徐红艳 《小型微型计算机系统》 CSCD 北大核心 2018年第8期1805-1808,共4页
K-means算法随机选取初始簇中心易导致聚类不稳定、准确率低等问题.为了解决上述问题,提出融入密度和距离的K-means初始簇中心优选方法.该方法首先选取距离最远的两个样本点进行贪心策略的密度聚类,形成两个临时初始簇,接着不断选取距... K-means算法随机选取初始簇中心易导致聚类不稳定、准确率低等问题.为了解决上述问题,提出融入密度和距离的K-means初始簇中心优选方法.该方法首先选取距离最远的两个样本点进行贪心策略的密度聚类,形成两个临时初始簇,接着不断选取距临时初始簇质心距离乘积最大值点进行密度聚类,直到形成K个临时初始簇,最后在每个簇中选取核心点作为初始簇中心.在Letter数据集进行实验,证明所选取初始簇中心进行K-means聚类具有更好的稳定性、更高的准确率. 展开更多
关键词 K-means算法 密度 贪心策略 最大距离 初始簇中心
下载PDF
上一页 1 2 36 下一页 到第
使用帮助 返回顶部