期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
一种改进初始中心点的FCM算法 被引量:2
1
作者 唐德玉 曹东 杨进 《现代计算机(中旬刊)》 2016年第11期7-11,25,共6页
传统FCM算法存在聚类初始中心点敏感及迭代次数多的缺点,提出一个改进聚类初始中心点的加强FCM算法。新算法通过数据转换及排序把数据划分到合适的簇中,从而找到最好的聚类初始中心点。在给定聚类数目的条件下,通过UCI机器学习数据库中... 传统FCM算法存在聚类初始中心点敏感及迭代次数多的缺点,提出一个改进聚类初始中心点的加强FCM算法。新算法通过数据转换及排序把数据划分到合适的簇中,从而找到最好的聚类初始中心点。在给定聚类数目的条件下,通过UCI机器学习数据库中的两组数据集进行实验比较,结果表明采用加强FCM算法比传统FCM算法收敛速度更快,有较高的准确率和稳定性。 展开更多
关键词 模糊C-均值 目标函数 聚类初始点 数据划分
下载PDF
一种优化的K-Means聚类算法 被引量:3
2
作者 姚奥 张宇 《工业控制计算机》 2016年第11期120-121,124,共3页
聚类在数据挖掘领域应用广泛,但是传统的K-Means聚类算法存在对初始聚类中心点敏感以及需要人工设定聚类个数K等问题。针对这些问题,在进行评论文本特征词聚类的过程中,提出了一种改进的K-Means聚类算法,综合利用距离和密度来选择初始... 聚类在数据挖掘领域应用广泛,但是传统的K-Means聚类算法存在对初始聚类中心点敏感以及需要人工设定聚类个数K等问题。针对这些问题,在进行评论文本特征词聚类的过程中,提出了一种改进的K-Means聚类算法,综合利用距离和密度来选择初始聚类中心点,并利用评测标准来确定聚类的个数K。此外,在聚类过程中,提出了利用基于知网的相似度计算修正相似度矩阵,以及利用成对约束规则来提高聚类的准确度。实验证明,提出的方法是切实有效的。 展开更多
关键词 距离 密度 初始中心
下载PDF
一种应用复杂网络特征的K-means初始化方法 被引量:2
3
作者 田生文 王伊蕾 李阿丽 《计算机工程与应用》 CSCD 北大核心 2010年第6期127-129,共3页
K-means算法是一种基于划分的聚类算法,具有算法简单且收敛速度快的特点。但该算法的性能依赖于聚类中心的初始位置的选择。拓展了复杂网络的重要特征,针对带有属性的数据对象所构成的数据集,定义了多维属性对象的度、聚集度和聚集系数... K-means算法是一种基于划分的聚类算法,具有算法简单且收敛速度快的特点。但该算法的性能依赖于聚类中心的初始位置的选择。拓展了复杂网络的重要特征,针对带有属性的数据对象所构成的数据集,定义了多维属性对象的度、聚集度和聚集系数,选取度和聚集系数高的K个点作为K-means聚类的初始中心点。实验数据表明,改进后的K-means算法较传统的算法具有更高的效率和准确度。 展开更多
关键词 K—means算法 复杂网络特征 聚类初始点
下载PDF
面向大规模数据精简的聚类中心点优化和FCM算法设计 被引量:5
4
作者 江文奇 黄容 +1 位作者 牟华伟 袁亚纯 《数学的实践与认识》 2021年第17期144-151,共8页
基于FCM的大规模数据聚类算法设计中,聚类中心点选择的迭代次数较多易于造成算法模型伸缩性不强、敏感性较弱和陷入局部最小值的难题.以大规模数据点精简算法设计为切入点,研究初始聚类中心点选择与FCM模型设计.首先,基于K近邻思想提出... 基于FCM的大规模数据聚类算法设计中,聚类中心点选择的迭代次数较多易于造成算法模型伸缩性不强、敏感性较弱和陷入局部最小值的难题.以大规模数据点精简算法设计为切入点,研究初始聚类中心点选择与FCM模型设计.首先,基于K近邻思想提出了数据点精简算法,获得精简之后的代表点集合.其次,兼顾原始数据点的稀疏程度和精简后代表点的分布特征,提出了基于密度的初始聚类中心点选取规则和具体步骤.再次,基于代表点集合和初始聚类中心点结果,给出了一种精简再融合的两阶段聚类算法.最后,运用仿真方法说明了本方法的有效性和优越性. 展开更多
关键词 算法 FCM 初始中心 K互近邻 数据精简
原文传递
一种海量数据快速聚类算法 被引量:8
5
作者 何倩 李双富 +1 位作者 黄焕 徐红 《北京邮电大学学报》 EI CAS CSCD 北大核心 2020年第3期118-124,共7页
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少Kmeans的欧氏距离计算次数.该算法基于S... 为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少Kmeans的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法. 展开更多
关键词 快速 SPARK 最佳聚类初始点 网格划分
原文传递
基于密度期望和有效性指标的K-均值算法 被引量:10
6
作者 何云斌 肖宇鹏 +1 位作者 万静 李松 《计算机工程与应用》 CSCD 2013年第24期105-111,共7页
传统K-均值聚类算法虽然收敛速度快,但存在聚类数k无法预先确定,并且算法对初始中心点敏感的缺点。针对上述缺点,提出了基于密度期望和聚类有效性Silhouette指标的K-均值优化算法。给出了基于密度期望的初始中心点选取方案,将处于密度... 传统K-均值聚类算法虽然收敛速度快,但存在聚类数k无法预先确定,并且算法对初始中心点敏感的缺点。针对上述缺点,提出了基于密度期望和聚类有效性Silhouette指标的K-均值优化算法。给出了基于密度期望的初始中心点选取方案,将处于密度期望区间内相距最远的k个样本作为初始聚类中心。该方案可有效降低K-均值算法对初始中心点的依赖,从而获得较高的聚类质量。在此基础上,可进一步通过选择合适的聚类有效性指标Silhouette指标分析不同k值下的每次聚类结果,确定最佳聚类数,则可有效改善k值无法预先确定的缺点。实验及分析结果验证了所提出方案的可行性和有效性。 展开更多
关键词 K-均值 初始中心 期望密度 k值优化
下载PDF
一种基于密度的K-means算法 被引量:3
7
作者 乔小妮 张明新 史变霞 《电脑开发与应用》 2008年第10期9-11,共3页
基于密度聚类的思想,提出了一种改进的K-means算法。算法吸取密度聚类算法的优点,利用对象的t-邻域密度作为选择初始聚类中心点的条件,选出较优的初始中心点,从而得到较好的聚类效果。通过实验表明,此方法相对于随机选取初始聚类中心点... 基于密度聚类的思想,提出了一种改进的K-means算法。算法吸取密度聚类算法的优点,利用对象的t-邻域密度作为选择初始聚类中心点的条件,选出较优的初始中心点,从而得到较好的聚类效果。通过实验表明,此方法相对于随机选取初始聚类中心点准确率较高、稳定性强、可伸缩性好。 展开更多
关键词 K—means算法 t-邻域密度 初始中心
下载PDF
改进Kmeans算法的海洋数据异常检测 被引量:27
8
作者 蒋华 季丰 +2 位作者 王慧娇 王鑫 罗一迪 《计算机工程与设计》 北大核心 2018年第10期3132-3136,共5页
为解决Kmeans算法随机指定初始点聚类和海洋Argo浮标数据异常问题,提出一种改进Kmeans算法的海洋数据异常检测方法。提出一种改进Kmeans算法DMKmeans(density mathematics Kmeans),选取给定邻域范围内最近邻数据点最多的点为初始中心点... 为解决Kmeans算法随机指定初始点聚类和海洋Argo浮标数据异常问题,提出一种改进Kmeans算法的海洋数据异常检测方法。提出一种改进Kmeans算法DMKmeans(density mathematics Kmeans),选取给定邻域范围内最近邻数据点最多的点为初始中心点,迭代聚类,直到准则函数收敛,聚类结束;基于DMKmeans算法对数据集聚类,使用数学模型为准则进行海洋监测数据异常检测。通过海洋监测数据异常检测仿真实验,将DMKmeans算法与传统Kmeans算法及MinMaxKmeans算法做对比分析,其结果表明,提出算法能有效提高聚类准确率和异常检测率。 展开更多
关键词 Kmeans算法 初始中心 离群 海洋监测数据 异常检测
下载PDF
面向法律问题数据的K-means聚类分析技术的研究
9
作者 马尧 《网络安全技术与应用》 2023年第9期35-37,共3页
随着大数据的时代的到来,法律知识库所包含的数据越来越多。聚类分析作为数据分析的常见方法,对处理分析法律问题数据十分重要,为了使聚类更准确,本文对传统K-means算法准确率不理想且容易出现空簇的问题进行了改进,在初始点的选择上采... 随着大数据的时代的到来,法律知识库所包含的数据越来越多。聚类分析作为数据分析的常见方法,对处理分析法律问题数据十分重要,为了使聚类更准确,本文对传统K-means算法准确率不理想且容易出现空簇的问题进行了改进,在初始点的选择上采用tf-idf值较高的数据作为初始点,并针对传统算法聚类结果容易出现的空簇问题提出了使用二分法解决。针对不同数量级的数据进行对比实验,结果表明改进后的算法可以对比传统算法的准确性提升5%以上。 展开更多
关键词 K-MEANS算法 初始中心 空簇 法律问题数据
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部