期刊文献+
共找到822篇文章
< 1 2 42 >
每页显示 20 50 100
基于Tukey规则与初始中心点优化的K⁃means聚类改进算法 被引量:2
1
作者 柳菁 邱紫滢 +1 位作者 郭茂祖 余冬华 《数据采集与处理》 CSCD 北大核心 2023年第3期643-651,共9页
针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,... 针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,在核心子集上执行中心点逐个递增优化选择策略,选出初始中心点。在来自UCI的20个数据集上聚类结果表明,本文提出的算法优于K⁃means++聚类算法,有效地提升了聚类性能。 展开更多
关键词 数据挖掘 k⁃means聚类算法 Tukey规则 中心点优化
下载PDF
基于交通拥堵信息的高速公路拥堵路段ACK-Means聚类
2
作者 陈昕 阮永娇 肇毓 《科学技术与工程》 北大核心 2024年第21期9194-9200,共7页
为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇... 为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇类密度、簇类间距以及簇类强度,同时又考虑到数据样本的偶然性,对离群点进行合理分配,ACK-Means算法可实现自适应确定聚类中心C和类别K值。基于实际交通拥堵信息构建数据集,Python编程实现高速公路拥堵路段ACK-Means聚类,巧妙解决了高速公路拥堵路段聚类数目K和聚类中心C设定问题。聚类结果表明,ACK-Means算法实现高速公路拥堵路段无监督聚类,聚类结果完全基于实际的高速公路交通拥堵信息,具有更高的实用性。 展开更多
关键词 交通拥堵 ACk-means算法 自适应中心 自适应k 交通拥堵信息
下载PDF
基于K-means聚类分析和多元线性回归的相关流量数据处理方法
3
作者 张李娜 姜志诚 +1 位作者 刘大勇 刘兴斌 《石油管材与仪器》 2024年第1期52-56,62,共6页
相关流量计在油井产出剖面测量中得到了成功的应用。但因传感器、调理电路以及流体本身噪声的影响,相关流量计所测量的渡越时间值会出现少量异常数据,使瞬时流速的计算结果与实际值相差很大,进而平均流量计算也出现较大的测量误差。对... 相关流量计在油井产出剖面测量中得到了成功的应用。但因传感器、调理电路以及流体本身噪声的影响,相关流量计所测量的渡越时间值会出现少量异常数据,使瞬时流速的计算结果与实际值相差很大,进而平均流量计算也出现较大的测量误差。对此提出基于K-means聚类算法对渡越时间样本数据聚类分析,并根据聚类结果建立多元线性回归预测模型,合理预测渡越时间值,以修正渡越时间的异常值。对预测值与实际值进行比较,最终获得准确的相关流量数据。采用多相流装置的实验数据对所建立的方法进行验证,结果表明,该方法可有效消除渡越时间的异常,优化流量测量的数据,对两相流流量测量有一定的实践意义。 展开更多
关键词 相关流量计 渡越时间 k均值算法 多元线性回归
下载PDF
用于雷达信号分选的K中位最近邻聚类算法
4
作者 伍佳钰 甄佳奇 《黑龙江大学自然科学学报》 CAS 2024年第4期496-504,共9页
在处理雷达信号时,基于密度的空间聚类(Density-based spatial clustering of applications with noise,DBSCAN)分选算法依赖于参数或阈值的选取,影响分选的准确率。为此提出了一种改进的雷达信号脉冲分选算法,在DBSCAN聚类基础上结合了... 在处理雷达信号时,基于密度的空间聚类(Density-based spatial clustering of applications with noise,DBSCAN)分选算法依赖于参数或阈值的选取,影响分选的准确率。为此提出了一种改进的雷达信号脉冲分选算法,在DBSCAN聚类基础上结合了K中位最近邻(K-median nearest neighbor,KMNN)算法,通过引入自衰减系数并设置阈值上限对参数值列表进行二次处理,可以自适应根据聚类结果与不同参数时的K值之间的关系确定最优的邻域半径和最少点个数,提高了分选的正确率。通过仿真实验验证了算法利用雷达脉冲描述字特征进行自适应分选的有效性。 展开更多
关键词 雷达信号分选 DBSCAN k中位最近邻算法
下载PDF
基于改进k-means算法的科研仪器机时智能计算系统
5
作者 李姜超 谢一航 +1 位作者 李辰 苏爽 《微型电脑应用》 2024年第10期156-160,共5页
传统的机时统计常使用人工,不仅效率低,而且成本相对较大,因此在传统的机时计算的基础上提出一种基于改进k均值聚类算法的科研仪器机时智能计算系统。通过对仪器机时电流数据的聚类分析,完成对仪器机时的计算和统计,同时将传统k均值聚... 传统的机时统计常使用人工,不仅效率低,而且成本相对较大,因此在传统的机时计算的基础上提出一种基于改进k均值聚类算法的科研仪器机时智能计算系统。通过对仪器机时电流数据的聚类分析,完成对仪器机时的计算和统计,同时将传统k均值聚类算法进行改进,提升其系统机时计算的准确性。结果表明,使用改进k均值聚类算法后的机时系统在仪器的机时计算中表现更为优异,计算的时间与正常运行时间相同,能够在一定程度上达到0误差标准。由此可见,使用改进聚类算法进行仪器的机时统计能够提升机时计算结果的准确性。 展开更多
关键词 仪器机时 k均值算法 智能 电流数据
下载PDF
基于划分的数据挖掘K-means聚类算法分析 被引量:19
6
作者 曾俊 《现代电子技术》 北大核心 2020年第3期14-17,共4页
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成... 为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K⁃means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 展开更多
关键词 数据挖掘 分析 k⁃means聚类算法 中心选取 k⁃means算法改进 初始中心点
下载PDF
基于改进PSO-KMeans煤炭异物筛选算法研究
7
作者 朱名乾 刘宾 《舰船电子工程》 2024年第2期35-39,共5页
采煤过程中异物自动识别和分拣是实现矿业信息化的关键技术之一。传统双能X射线系统根据R值算法可有效识别出煤炭中混杂的钢筋与胶皮,却难以识别与煤炭组成成分相似的木质杂质。针对这一问题,提出基于L_(0)范数最小化与改进PSO-KMeans... 采煤过程中异物自动识别和分拣是实现矿业信息化的关键技术之一。传统双能X射线系统根据R值算法可有效识别出煤炭中混杂的钢筋与胶皮,却难以识别与煤炭组成成分相似的木质杂质。针对这一问题,提出基于L_(0)范数最小化与改进PSO-KMeans的木质杂质筛选算法,借助L_(0)范数最小化算法平滑图像,去除煤灰干扰,利用改进PSO-KMeans聚类算法与基于距离变换的分水岭算法实现图像分割,根据离心率与矩形度进行木质杂质识别,并通过仿真实验验证方法的可行性。经验证此方法能有效筛选出煤炭中混杂的木质杂质。 展开更多
关键词 L_0范数最小化算法 粒子群优化算法 k均值算法 分水岭算法
下载PDF
基于改进K均值聚类算法的侦察数据分选方法研究
8
作者 胡华强 王喜 《软件》 2024年第9期4-6,共3页
由于电磁环境的复杂性,对侦察数据的分选是目标准确识别的前提,传统的基于信号特征的分选方法计算量大、分选结果不可靠,采用K均值聚类算法时,初始值的选择是难题。为改进K均值聚类算法,采用模拟退火和遗传算法相结合的方法对初始值和... 由于电磁环境的复杂性,对侦察数据的分选是目标准确识别的前提,传统的基于信号特征的分选方法计算量大、分选结果不可靠,采用K均值聚类算法时,初始值的选择是难题。为改进K均值聚类算法,采用模拟退火和遗传算法相结合的方法对初始值和聚类中心进行动态更新,仿真和试验结果表明分选结果准确可靠。 展开更多
关键词 k均值 算法 信号分选
下载PDF
基于改进SOM+K-means算法的客户价值研究
9
作者 王朋亮 单剑锋 《软件》 2024年第3期4-7,65,共5页
为提高多特征参数聚类相似度,针对多特征参数相关性和分布不等问题,提出一种改进的聚类算法,并以此算法研究RFM客户价值模型。此改进算法,通过矩阵旋转和压缩变换以及协方差矩阵处理,构造一种聚类相似度目标的距离函数,以此距离函数结合... 为提高多特征参数聚类相似度,针对多特征参数相关性和分布不等问题,提出一种改进的聚类算法,并以此算法研究RFM客户价值模型。此改进算法,通过矩阵旋转和压缩变换以及协方差矩阵处理,构造一种聚类相似度目标的距离函数,以此距离函数结合SOM算法和K-means算法各自优点,设计改进SOM+K-means组合聚类算法。应用该算法创建RFM客户价值模型,并实验验证。通过轮廓系数法评估,该算法聚类的轮廓系数相比原K-means和SOM算法聚类的轮廓系数,分别提高约0.129和0.126。该聚类算法提高了RFM客户价值聚类效果,为客户价值研究提供了一种新的聚类方法。 展开更多
关键词 协方差矩阵 自组织神经网络 k均值 算法 RFM客户价值
下载PDF
基于K-means聚类层次分析模型的中沙环礁地质环境稳定性定量分析 被引量:1
10
作者 覃茂刚 龙根元 +3 位作者 李海云 黄海波 陈万利 陈文 《热带海洋学报》 CAS CSCD 北大核心 2023年第2期113-123,共11页
中沙环礁位于中国南海的中心地带,是连接东沙、西沙和南沙群岛的重要枢纽。文章基于中沙环礁地形、地质采样、多道地震等调查数据,选取水深、沉积物类型、构造、滑坡易发区和坡度5个影响因子,采用K均值聚类算法(K-means)和层次分析法对... 中沙环礁位于中国南海的中心地带,是连接东沙、西沙和南沙群岛的重要枢纽。文章基于中沙环礁地形、地质采样、多道地震等调查数据,选取水深、沉积物类型、构造、滑坡易发区和坡度5个影响因子,采用K均值聚类算法(K-means)和层次分析法对中沙环礁的稳定性进行定量分析,将研究区划分为稳定性好、较好、中等、较差、差5个等级。分析了不同因子对中沙环礁稳定性的影响,其中沉积物类型、坡度和水深是影响台地稳定性的主要因素。台地周缘斜坡区稳定性主要受坡度、断裂构造和滑坡易发区等因素的控制,而台地周缘斜坡外深水区坡度因子贡献最大,整体上环礁北部和西部的稳定性优于东部和南部。环礁台地和台地周缘斜坡外深水区稳定性最好,越靠近台地斜坡稳定性逐渐变差,台地斜坡上缘区域稳定性最差。评价结果可为研究区的开发规划、海底管线工程建设及防灾减灾提供基础地质服务。 展开更多
关键词 中沙环礁 地质环境 稳定性 k均值算法
下载PDF
基于机器学习的茶树DNA聚类算法
11
作者 杨小平 倪萍 +4 位作者 诸葛天秋 罗跃新 郭春雨 庞月兰 吴雨婷 《广西大学学报(自然科学版)》 CAS 北大核心 2024年第2期386-399,共14页
为了研究茶树基因序列的聚类问题,设计一种基于累计方差贡献率进行改进的核主成分分析(KPCA)与k均值(k-means)++聚类算法相结合的降维聚类算法(KPCA-k-means++)。将基因库数据集筛选分组后,利用k-mers算法提取基因数据的数据特征,根据... 为了研究茶树基因序列的聚类问题,设计一种基于累计方差贡献率进行改进的核主成分分析(KPCA)与k均值(k-means)++聚类算法相结合的降维聚类算法(KPCA-k-means++)。将基因库数据集筛选分组后,利用k-mers算法提取基因数据的数据特征,根据累计方差贡献率的占比大于85%的标准确定降维主元个数对KPCA进行降维改进并采用k-means++算法对降维后数据聚类,通过CH(Calinski-Harabaze Index)指标和响应时间分析聚类结果。结果表明:在单独聚类、KPCA聚类、改进PCA聚类、改进KPCA聚类4种处理方式中,改进KPCA-k-means++算法在不同处理方式和不同样本数的对比下,CH指标均为最高,与未改进时相比平均高出33%。在响应时间方面,改进KPCA-k-means++算法与同样改进PCA-k-means++算法在不同聚类数和样本数的对比下响应时间均较短。改进KPCA-k-means++算法能够保证对于茶树的基因序列的聚类准确率和聚类速度,表现出极好的聚类稳定性。 展开更多
关键词 核主成分分析 累计方差贡献率 k均值算法 基因
下载PDF
K-means算法初始聚类中心选择的优化 被引量:50
12
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 kmeans算法 初始中心 TDkM算法
下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:62
13
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 kmeans算法 初始中心 直方图 最优划分方法
下载PDF
初始中心优化的K-Means聚类算法 被引量:47
14
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 kmeans算法 初始中心 优化
下载PDF
优化初始聚类中心的改进k-means算法 被引量:56
15
作者 张靖 段富 《计算机工程与设计》 CSCD 北大核心 2013年第5期1691-1694,1699,共5页
传统k-means算法随机选取初始聚类中心使聚类结果不稳定,诸多优化算法的时间复杂度较高,为了提高聚类稳定性并降低时间复杂度,提出了基于个体轮廓系数自适应地选取优秀样本以确定初始聚类中心的改进k-means算法。该算法多次调用传统k-me... 传统k-means算法随机选取初始聚类中心使聚类结果不稳定,诸多优化算法的时间复杂度较高,为了提高聚类稳定性并降低时间复杂度,提出了基于个体轮廓系数自适应地选取优秀样本以确定初始聚类中心的改进k-means算法。该算法多次调用传统k-means算法聚类,根据k个类中心的个体轮廓系数以及各样本与类中心的距离,自适应地选取优秀样本,求其均值作为初始聚类中心。在多个UCI数据集上的实验表明,该算法聚类时间短,具有较高的轮廓系数和准确率。 展开更多
关键词 k均值算法 初始中心 个体轮廓系数 自适应
下载PDF
模糊K-Harmonic Means聚类算法 被引量:6
16
作者 赵恒 杨万海 张高煜 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2005年第4期603-606,638,共5页
对K-HarmonicMeans算法进行扩展,考虑到数据点对不同类的隶属关系,将模糊的概念应用到聚类中,提出了模糊K-HarmonicMeans算法,推导出聚类中心和模糊隶属度的迭代公式.在中心迭代聚类算法统一框架的基础上,推导出FKHM算法聚类中心的条件... 对K-HarmonicMeans算法进行扩展,考虑到数据点对不同类的隶属关系,将模糊的概念应用到聚类中,提出了模糊K-HarmonicMeans算法,推导出聚类中心和模糊隶属度的迭代公式.在中心迭代聚类算法统一框架的基础上,推导出FKHM算法聚类中心的条件概率表达式以及在迭代过程中的数据加权函数表达式.最后,用Folkes&Mallows指标对聚类结果进行评价.实验表明,模糊K-HarmonicMeans(KHM)算法在聚类对于初值不敏感的同时提高了聚类结果的精确度,达到较好的聚类效果. 展开更多
关键词 模糊k—Harmonic means 中心 条件概率 Folkes & Mallows指标
下载PDF
基于初始聚类中心优化和维间加权的改进K-means算法 被引量:7
17
作者 王越 王泉 +1 位作者 吕奇峰 曾晶 《重庆理工大学学报(自然科学)》 CAS 2013年第4期77-80,共4页
针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-m... 针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-means算法的聚类结果进行对比分析。实验证明:改进后的算法稳定,且聚类的准确率达到了92%。 展开更多
关键词 kmeans算法 初始中心 维间加权 Iris数据集
下载PDF
K-means聚类算法的研究 被引量:46
18
作者 韩晓红 胡彧 《太原理工大学学报》 CAS 北大核心 2009年第3期236-239,共4页
为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初... 为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理。将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高。 展开更多
关键词 数据挖掘 kmeans算法 初始中心 分析
下载PDF
K-means聚类算法研究综述 被引量:306
19
作者 王千 王成 +1 位作者 冯振元 叶金凤 《电子设计工程》 2012年第7期21-24,共4页
总结评述了K-means聚类算法的研究现状,指出K-means聚类算法是一个NP难优化问题,无法获得全局最优。介绍了K-means聚类算法的目标函数、算法流程,并列举了一个实例,指出了数据子集的数目K、初始聚类中心选取、相似性度量和距离矩阵为K-m... 总结评述了K-means聚类算法的研究现状,指出K-means聚类算法是一个NP难优化问题,无法获得全局最优。介绍了K-means聚类算法的目标函数、算法流程,并列举了一个实例,指出了数据子集的数目K、初始聚类中心选取、相似性度量和距离矩阵为K-means聚类算法的3个基本参数。总结了K-means聚类算法存在的问题及其改进算法,指出了K-means聚类的进一步研究方向。 展开更多
关键词 k-means算法 NP难优化问题 数据子集的数目k 初始中心选取 相似性度量和距离矩阵
下载PDF
基于初始中心优化的遗传K-means聚类新算法 被引量:17
20
作者 孙秀娟 刘希玉 《计算机工程与应用》 CSCD 北大核心 2008年第23期166-168,182,共4页
一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出... 一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心。实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点。为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K-means算法(PKM)和遗传算法相结合的混合算法(PGKM),该算法在提高紧凑度(类内距)和分离度(类间距)的同时自动搜索最佳聚类数k,对k个初始中心优化后再聚类,不断地循环迭代,得到满足终止条件的最优聚类。实验证明该算法具有更好的聚类质量和综合性能。 展开更多
关键词 kmeans算法 遗传算法
下载PDF
上一页 1 2 42 下一页 到第
使用帮助 返回顶部