期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
基于主题词向量中心点的K-means文本聚类算法
1
作者 季铎 刘云钊 +1 位作者 彭如香 孔华锋 《计算机应用与软件》 北大核心 2024年第10期282-286,318,共6页
K-means由于其时间复杂度低运行速度快一直是最为流行的聚类算法之一,但是该算法在进行聚类时需要预先给出聚类个数和初始类中心点,其选取得合适与否会直接影响最终聚类效果。该文对初始类中心和迭代类中心的选取进行大量研究,根据决策... K-means由于其时间复杂度低运行速度快一直是最为流行的聚类算法之一,但是该算法在进行聚类时需要预先给出聚类个数和初始类中心点,其选取得合适与否会直接影响最终聚类效果。该文对初始类中心和迭代类中心的选取进行大量研究,根据决策图进行初始类中心的选择,利用每个类簇的主题词向量替代均值作为迭代类中心。实验表明,该文的初始点选取方法能够准确地选取初始点,且利用主题词向量作为迭代类中心能够很好地避免噪声点和噪声特征的影响,很大程度上地提高了K-means算法的性能。 展开更多
关键词 k-MEANS 初始点 决策图 迭代类中心 主题词向量
下载PDF
基于参数优化VMD和改进K聚类判据融合的配电网故障选线方法 被引量:5
2
作者 王建元 张宇辉 刘铖 《南方电网技术》 CSCD 北大核心 2023年第7期135-145,共11页
针对现有暂态量选线方法易受到故障相角、过渡电阻、噪声、谐波及判据阈值的影响,提出基于参数优化变分模态分解(variational mode decomposition,VMD)和改进K聚类判据融合的选线方法。首先对分解过程的3个关键性参数进行动态优化,利用... 针对现有暂态量选线方法易受到故障相角、过渡电阻、噪声、谐波及判据阈值的影响,提出基于参数优化变分模态分解(variational mode decomposition,VMD)和改进K聚类判据融合的选线方法。首先对分解过程的3个关键性参数进行动态优化,利用信号频谱及分量特性确定VMD分解层数,并以算术优化算法求取最佳惩罚因子,剔除了工频、噪声及谐波干扰,再根据分解层数与各模态频谱确定模态中心频率以提高分解效率。其次,以优化后的VMD获取余弦相似度、高频幅值和直流能量作为互补的故障选线判据值。最后以改进K聚类算法实现多判据融合,弥补了单一判据的局限性。理论分析、仿真与实测结果表明,所提方法适用于分布式电源接入的电网,不受故障位置、故障相角及过渡电阻的影响,具有优异的抗谐波与噪声干扰性能。 展开更多
关键词 故障选线 变分模态分解 算术优化算法 k中心点聚类 抗噪性
下载PDF
基于Tukey规则与初始中心点优化的K⁃means聚类改进算法 被引量:2
3
作者 柳菁 邱紫滢 +1 位作者 郭茂祖 余冬华 《数据采集与处理》 CSCD 北大核心 2023年第3期643-651,共9页
针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,... 针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,在核心子集上执行中心点逐个递增优化选择策略,选出初始中心点。在来自UCI的20个数据集上聚类结果表明,本文提出的算法优于K⁃means++聚类算法,有效地提升了聚类性能。 展开更多
关键词 数据挖掘 k⁃means聚类算法 Tukey规则 中心点优化
下载PDF
基于均衡化函数的k均值优化算法 被引量:7
4
作者 钱雪忠 施培蓓 +1 位作者 张明阳 汪中 《计算机工程》 CAS CSCD 北大核心 2008年第14期60-62,共3页
传统的k-means算法要求用户事先给定k值,限制了很多应用,初始中心点随机选择,容易导致局部极值点,常用的评价函数对于求解最优聚类数目也不理想。针对这些问题,该文提出一种新的评价函数——均衡化函数,采用基于密度的初始化中心点选择... 传统的k-means算法要求用户事先给定k值,限制了很多应用,初始中心点随机选择,容易导致局部极值点,常用的评价函数对于求解最优聚类数目也不理想。针对这些问题,该文提出一种新的评价函数——均衡化函数,采用基于密度的初始化中心点选择算法,自动生成聚类数目,实验结果表明了改进算法的有效性。 展开更多
关键词 k-均值算法 密度 初始中心点 均衡化函数
下载PDF
基于K中心点和粗糙集的KNN分类算法 被引量:8
5
作者 文武 李培强 《计算机工程与设计》 北大核心 2018年第11期3389-3394,共6页
为有效解决KNN算法在文本分类时效率随着数据规模的增大而降低这一问题,提出基于K中心点(K-Medoids)和粗糙集(rough set)的KNN分类方法 (KRS-KNN)。通过K中心点算法对文本数据集进行聚合,形成类簇,计算簇心和其它样本点的相异度,将相异... 为有效解决KNN算法在文本分类时效率随着数据规模的增大而降低这一问题,提出基于K中心点(K-Medoids)和粗糙集(rough set)的KNN分类方法 (KRS-KNN)。通过K中心点算法对文本数据集进行聚合,形成类簇,计算簇心和其它样本点的相异度,将相异度大于最后簇心相异度的样本剔除,运用粗糙集理论对得到的每个类簇进行分割,通过上、下作差得到的边界样本,通过KNN算法确定其最终类别。实验结果表明,文本数据的计算规模得到了降低,提高了文本数据的分类效率。 展开更多
关键词 文本分类 k中心点 粗糙集 相异度 样本剔除
下载PDF
K均值聚类算法初始质心选择的改进 被引量:15
6
作者 孙可 刘杰 王学颖 《沈阳师范大学学报(自然科学版)》 CAS 2009年第4期448-450,共3页
聚类分析在信息检索和数据挖掘等领域都有很广泛的应用,K均值聚类算法是一个比较简洁和快速的聚类算法,但是它存在着初始聚类个数必须事先设定以及初始质心的选择也具有随机性等缺陷,造成聚类的结果不是最优的。针对K均值聚类算法中的... 聚类分析在信息检索和数据挖掘等领域都有很广泛的应用,K均值聚类算法是一个比较简洁和快速的聚类算法,但是它存在着初始聚类个数必须事先设定以及初始质心的选择也具有随机性等缺陷,造成聚类的结果不是最优的。针对K均值聚类算法中的随机指定初始质心的缺点,提出了基于密度和最近邻相似度的初始质心选择算法,实验显示该算法可以生成质量较高而且较稳定的聚类结果,但是改进的算法需要事先设定最近邻相似度的阈值计算量较大等缺点,还有待改进。 展开更多
关键词 聚类 k均值聚类算法 初始质心 密度 最近邻相似度
下载PDF
一种优化初始中心的K-means聚类算法 被引量:22
7
作者 邓海 覃华 孙欣 《计算机技术与发展》 2013年第11期42-45,共4页
针对传统K-means聚类算法对初始聚类中心的敏感性和随机性,造成容易陷入局部最优解和聚类结果波动性大的问题,结合密度法和最大化最小距离的思想,提出基于最近高密度点间的垂直中心点优化初始聚类中心的K-means聚类算法。该算法选取相... 针对传统K-means聚类算法对初始聚类中心的敏感性和随机性,造成容易陷入局部最优解和聚类结果波动性大的问题,结合密度法和最大化最小距离的思想,提出基于最近高密度点间的垂直中心点优化初始聚类中心的K-means聚类算法。该算法选取相互间距离最大的K对高密度点,并以这K对高密度点的均值作为聚类的初始中心,再进行Kmeans聚类。实验结果表明,该算法有效排除样本中含有的孤立点,并且聚类过程收敛速度快,聚类结果有更好的准确性和稳定性。 展开更多
关键词 k—means聚类 聚类中心 高密度点 垂直中心点
下载PDF
基于密度的K-means聚类中心选取的优化算法 被引量:48
8
作者 周炜奔 石跃祥 《计算机应用研究》 CSCD 北大核心 2012年第5期1726-1728,共3页
针对传统的K-means算法对于初始聚类中心点和聚类数的敏感问题,提出了一种优化初始聚类中心选取的算法。该算法针对数据对象的分布密度以及计算最近两点的垂直中点方法来确定k个初始聚类中心,再结合均衡化函数对聚类个数进行优化,以获... 针对传统的K-means算法对于初始聚类中心点和聚类数的敏感问题,提出了一种优化初始聚类中心选取的算法。该算法针对数据对象的分布密度以及计算最近两点的垂直中点方法来确定k个初始聚类中心,再结合均衡化函数对聚类个数进行优化,以获得最优聚类。采用标准的UCI数据集进行实验对比,发现改进后的算法相比传统的算法有较高的准确率和稳定性。 展开更多
关键词 k-均值 数据挖掘 聚类中心 垂直中点 密度
下载PDF
基于KNN算法的改进K-means算法 被引量:6
9
作者 徐文进 管克航 +2 位作者 寻晴晴 许瑶 解钦 《青岛科技大学学报(自然科学版)》 CAS 2019年第5期107-111,118,共6页
针对于K-means算法的缺点做出了一些改进,提出了一种基于KNN算法改进K-means的算法。改进后的算法解决了K-means算法K值无法确定和数据分类中的不强、易受异常数据干扰的缺点,提高了算法的聚类效果以及削弱初始聚类中心选择的随机性对... 针对于K-means算法的缺点做出了一些改进,提出了一种基于KNN算法改进K-means的算法。改进后的算法解决了K-means算法K值无法确定和数据分类中的不强、易受异常数据干扰的缺点,提高了算法的聚类效果以及削弱初始聚类中心选择的随机性对于聚类结果易陷入局部最优的影响。实验表明,改进后的算法不仅解决了传统算法确定K值的问题,而且聚类结果稳定且聚类效果良好。 展开更多
关键词 数据中心点 k-MEANS 局部最优 kNN算法
下载PDF
一种优化初始化中心的k均值web信息聚类算法 被引量:2
10
作者 张世博 周义明 《北京石油化工学院学报》 2011年第4期55-58,共4页
k-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用。由于k-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果。针对k-means算法所存在的问题,构造了文本集合的相似度矩阵,基于... k-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用。由于k-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果。针对k-means算法所存在的问题,构造了文本集合的相似度矩阵,基于平均相似度集合通过排序迭代优选出了初始中心点。实验表明此算法可以有效减少迭代次数并提高聚类精度,最终获得较好的聚类效果。 展开更多
关键词 k均值 聚类 初始中心点 优化
下载PDF
基于划分的数据挖掘K-means聚类算法分析 被引量:19
11
作者 曾俊 《现代电子技术》 北大核心 2020年第3期14-17,共4页
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成... 为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K⁃means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 展开更多
关键词 数据挖掘 聚类分析 k⁃means聚类算法 聚类中心选取 k⁃means算法改进 初始中心点
下载PDF
改进的K-means算法 被引量:1
12
作者 王芳妮 贺兴时 +1 位作者 谌路 杨敏 《纺织高校基础科学学报》 CAS 2012年第3期370-373,共4页
针对传统K-means聚类算法对初始点敏感性问题,根据数据样本分布,采用启发式的方法选取初始聚类中心点,设计了一种均衡化评价函数,由此函数为准则自动生成聚类数目.通过实验验证了该算法的收敛性.
关键词 k-MEANS算法 数据分布 初始中心点 均衡化函数
下载PDF
基于优化初始中心点的K-means文本聚类算法 被引量:8
13
作者 张世博 《计算机与数字工程》 2011年第10期30-31,共2页
K-means算法终止于一个局部最优状态,所以初始中心点的选择会在很大程度上影响其聚类效果。该文针对K-means算法所存在的问题,提出了一种优化初始中心点的算法。实验表明可以有效减少迭代次数并提高聚类精度,最终获得较好的聚类效果。
关键词 k均值 聚类 初始中心点
下载PDF
基于改进K中心点的语音分组识别算法 被引量:1
14
作者 李云 《电子设计工程》 2020年第10期152-155,共4页
针对语音分组识别中,分组数量多时,识别率下降,分组数量少时,识别时间增加这一问题,提出一种改进K中心点的语音分组识别算法。该算法先将同一语音进行分段均值降维,然后将不同语音经过K中心点聚类分组。识别时先判断所在语音组,再进行... 针对语音分组识别中,分组数量多时,识别率下降,分组数量少时,识别时间增加这一问题,提出一种改进K中心点的语音分组识别算法。该算法先将同一语音进行分段均值降维,然后将不同语音经过K中心点聚类分组。识别时先判断所在语音组,再进行模式匹配。实验结果表明,相比于传统K均值聚类和传统K中心点算法,该算法能减少识别时间,提高识别率。 展开更多
关键词 语音识别 k中心点 k均值聚类 欧氏距离
下载PDF
基于2d-距离改进的K-means聚类算法研究 被引量:8
15
作者 陈福集 蒋芳 《太原理工大学学报》 CAS 北大核心 2012年第2期114-118,共5页
为了解决原始K-means算法随机选取聚类中心对聚类结果产生较大影响的不足和孤立点的存在对聚类精度的破坏,以及两者之间的相互牵制性,采用基于2d-距离的DKC值来对原始样本数据集进行预处理以分辨孤立点,同时确定初始的聚类中心,达到消... 为了解决原始K-means算法随机选取聚类中心对聚类结果产生较大影响的不足和孤立点的存在对聚类精度的破坏,以及两者之间的相互牵制性,采用基于2d-距离的DKC值来对原始样本数据集进行预处理以分辨孤立点,同时确定初始的聚类中心,达到消除两者相互影响的效果,使得聚类中心相对稳定,改进后的算法较原始的算法在准确度上得到了改进。 展开更多
关键词 2d距离 k—means算法 初始点选取 孤立点
下载PDF
基于初始中心点K均值聚类算法的改进方法研究 被引量:2
16
作者 卜天然 《通化师范学院学报》 2017年第2期60-63,共4页
传统聚类算法随机选取初始中心不能有效处理不规则数据集的边缘数据.该文主要叙述了K均值聚类算法基本思想和流程,详细分析了其算法的优点及存在的问题,提出对现有基于初始中心点K均值聚类算法的改进方法.
关键词 初始中心点 k均值聚类算法 改进方法
下载PDF
基于狮群优化的改进K-Means聚类算法研究 被引量:8
17
作者 胡啸 王玲燕 +2 位作者 张浩宇 常宇超 王银 《控制工程》 CSCD 北大核心 2022年第11期1996-2002,共7页
针对K-Means聚类算法对初始聚类中心选择依赖性强的问题,利用狮群优化算法的快速收敛性及易于获取全局最优解的优势,提出了一种基于狮群优化的改进K-Means聚类算法。通过狮群优化算法对狮王不断迭代更新,优化狮王位置,将算法停止执行时... 针对K-Means聚类算法对初始聚类中心选择依赖性强的问题,利用狮群优化算法的快速收敛性及易于获取全局最优解的优势,提出了一种基于狮群优化的改进K-Means聚类算法。通过狮群优化算法对狮王不断迭代更新,优化狮王位置,将算法停止执行时的狮王最优解作为聚类中心,替代传统算法经过随机初始化得到具有不确定因素的聚类中心。选择UCI数据集进行验证,实验结果表明,改进算法的聚类效果较好,有效降低了K-Means对初始聚类中心的依赖。将改进的K-Means聚类算法应用于点云精简过程,获得了较好的点云精简效果。 展开更多
关键词 聚类分析 k-MEANS聚类算法 狮群优化算法 聚类中心 点云精简
下载PDF
动态粒度结合中心点算法在电力设备缺陷管控中的应用研究
18
作者 万少明 代金磊 《中国高新科技》 2024年第3期79-81,共3页
针对电力设备缺陷管控问题,文章研究提出了一种基于改进k-中心点聚类算法与动态粒度的电力设备缺陷管控模型。首先,利用改进的k-中心点聚类算法对设备缺陷数据进行聚类处理;然后,将动态粒度与改进算法进行结合,用于构建缺陷管控模型。... 针对电力设备缺陷管控问题,文章研究提出了一种基于改进k-中心点聚类算法与动态粒度的电力设备缺陷管控模型。首先,利用改进的k-中心点聚类算法对设备缺陷数据进行聚类处理;然后,将动态粒度与改进算法进行结合,用于构建缺陷管控模型。结果表明,缺陷管控模型的数据聚类正确率为93.07%,聚类效率能够达到90.07%,同时数据识别准确率、召回率和F1值分别为93.27%、93.52%和0.951,均优于对比方法。这说明研究构建的电力设备缺陷管控模型显著可以提高设备的可靠性和稳定性。 展开更多
关键词 动态粒度 k-中心点聚类算法 电力设备 缺陷管控
下载PDF
K均值聚类算法的研究与优化 被引量:62
19
作者 陶莹 杨锋 +1 位作者 刘洋 戴兵 《计算机技术与发展》 2018年第6期90-92,共3页
聚类分析是数据挖掘的重要组成部分,K均值聚类算法是聚类分析方法中一种基本的划分式方法,也是无监督的机器学习方法。其具有效率高、容易理解和实现等优点,同时,可以对多种数据类型进行聚类,广泛应用于诸多领域。但是,K均值聚类算法也... 聚类分析是数据挖掘的重要组成部分,K均值聚类算法是聚类分析方法中一种基本的划分式方法,也是无监督的机器学习方法。其具有效率高、容易理解和实现等优点,同时,可以对多种数据类型进行聚类,广泛应用于诸多领域。但是,K均值聚类算法也有一些局限性。算法中合理的k值难以确定,而且算法选择初始聚类中心的随机性会导致聚类结果不稳定,同时,算法对噪声和离群点数据也有很强的敏感性。为了解决初始聚类中心随机性的问题,通过全局化思想对K均值聚类算法进行了改进,改进的聚类效果评价使用常用的误差平方和准则。实验结果表明,相较于一般的K均值聚类算法,全局K均值聚类算法得到了更好的聚类效果,同时提升了算法的稳定性。 展开更多
关键词 数据挖掘 k均值聚类 中心点 误差平方和
下载PDF
一种基于K均值预处理回溯的PAM算法 被引量:3
20
作者 罗德超 吴文亮 +2 位作者 姬应江 杨淑爱 胡君 《软件》 2011年第4期95-99,共5页
针对PAM算法在进行聚类时容易陷入死循环的缺陷,引用了回溯法来解决该问题。但是,加入回溯法的PAM算法具有计算量大迭代次数多的缺点,为了在PAM算法迭代过程中,尽量避免使用回溯法,于是进一步,提出了在进行PAM聚类前,采用K-means算法对... 针对PAM算法在进行聚类时容易陷入死循环的缺陷,引用了回溯法来解决该问题。但是,加入回溯法的PAM算法具有计算量大迭代次数多的缺点,为了在PAM算法迭代过程中,尽量避免使用回溯法,于是进一步,提出了在进行PAM聚类前,采用K-means算法对数据进行预处理,从而获得粗糙中心点,然后找出一组与粗糙中心点最接近的数据作为初始中心点,再进行PAM聚类。从而得到基于K-means预处理回溯法的PAM算法(K-means Data Preprocessing Backward Search PAM,简称KDPBS-PAM)。实验结果表明,KDPBS-PAM算法极大地改善了PAM算法的性能。 展开更多
关键词 PAM 回溯法 k均值数据预处理 粗糙中心点
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部