期刊文献+
共找到677篇文章
< 1 2 34 >
每页显示 20 50 100
基于机器学习的茶树DNA聚类算法
1
作者 杨小平 倪萍 +4 位作者 诸葛天秋 罗跃新 郭春雨 庞月兰 吴雨婷 《广西大学学报(自然科学版)》 CAS 北大核心 2024年第2期386-399,共14页
为了研究茶树基因序列的聚类问题,设计一种基于累计方差贡献率进行改进的核主成分分析(KPCA)与k均值(k-means)++聚类算法相结合的降维聚类算法(KPCA-k-means++)。将基因库数据集筛选分组后,利用k-mers算法提取基因数据的数据特征,根据... 为了研究茶树基因序列的聚类问题,设计一种基于累计方差贡献率进行改进的核主成分分析(KPCA)与k均值(k-means)++聚类算法相结合的降维聚类算法(KPCA-k-means++)。将基因库数据集筛选分组后,利用k-mers算法提取基因数据的数据特征,根据累计方差贡献率的占比大于85%的标准确定降维主元个数对KPCA进行降维改进并采用k-means++算法对降维后数据聚类,通过CH(Calinski-Harabaze Index)指标和响应时间分析聚类结果。结果表明:在单独聚类、KPCA聚类、改进PCA聚类、改进KPCA聚类4种处理方式中,改进KPCA-k-means++算法在不同处理方式和不同样本数的对比下,CH指标均为最高,与未改进时相比平均高出33%。在响应时间方面,改进KPCA-k-means++算法与同样改进PCA-k-means++算法在不同聚类数和样本数的对比下响应时间均较短。改进KPCA-k-means++算法能够保证对于茶树的基因序列的聚类准确率和聚类速度,表现出极好的聚类稳定性。 展开更多
关键词 核主成分分析 累计方差贡献率 k均值算法 基因
下载PDF
异构并行计算下高维混合型数据聚类算法研究
2
作者 祝鹏 《现代电子技术》 北大核心 2024年第9期139-142,共4页
高维数据维度增加,数据空间的体积呈指数增长,容易陷入“维数灾难”,导致聚类算法执行效率低,为此,提出异构并行计算下高维混合型数据聚类算法。构建高维混合型数据相异度矩阵,提取高维混合型数据的统计序列特征值,利用时间窗口进行特... 高维数据维度增加,数据空间的体积呈指数增长,容易陷入“维数灾难”,导致聚类算法执行效率低,为此,提出异构并行计算下高维混合型数据聚类算法。构建高维混合型数据相异度矩阵,提取高维混合型数据的统计序列特征值,利用时间窗口进行特征优化。采用K⁃Prototypes聚类算法提取高维混合型数据的统计序列特征,评估数据与类中心的相异性,计算数据与类中心的欧氏距离,实现高维混合型数据聚类。采用异构并行计算技术进行高维混合型数据K⁃Prototypes聚类的并行化处理,合理分配CPU与GPU工作,达到CPU与GPU的工作负载平衡,提高K⁃Prototypes的聚类效率。实验结果表明,此算法对于高维混合型数据的聚类效果好、运行时间短、性能稳定。 展开更多
关键词 异构并行计算 高维混合型数据 k⁃prototypes聚类算法 欧氏距离 统计序列特征 负载平衡
下载PDF
基于疯狂捕猎秃鹰算法的K均值互补迭代聚类优化
3
作者 黄鹤 温夏露 +3 位作者 杨澜 王会峰 高涛 茹锋 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第11期2147-2159,共13页
在处理庞大复杂的点云数据时,传统聚类方法精度低、耗时长并且受离群点影响大,针对以上问题,提出基于疯狂捕猎的柯西反向秃鹰搜索算法(QO-BESCH)的K均值互补迭代聚类优化方法.所提算法构建基于体元包围盒的初始聚类中心选择模型,提升初... 在处理庞大复杂的点云数据时,传统聚类方法精度低、耗时长并且受离群点影响大,针对以上问题,提出基于疯狂捕猎的柯西反向秃鹰搜索算法(QO-BESCH)的K均值互补迭代聚类优化方法.所提算法构建基于体元包围盒的初始聚类中心选择模型,提升初始化聚类中心质量;提出疯狂捕猎机制,同时融合动态自适应控制算子和柯西反向策略,提升秃鹰搜索算法(BES)的寻优能力,增加寻找聚类中心的成功率;利用QO-BESCH优化K均值聚类(KMC),在减小迭代次数的同时增加搜索效率,得到较好的聚类结果.利用UCI标准数据集对所提算法进行测试,并与8种聚类算法进行对比,实验结果证明了所提算法的优越性.将本研究算法结合PCL点云库应用于ModelNet40点云数据集聚类,结果表明,所提算法可以实现有效聚类,适用性较强. 展开更多
关键词 k均值(kMC) 体元密度 秃鹰搜索(BES)算法 点云 部件分割
下载PDF
基于改进K均值聚类的光谱重建训练样本选择研究
4
作者 刘振 刘莉 +2 位作者 樊硕 赵安然 刘思鲁 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第1期29-35,共7页
光谱反射率重建过程中,训练样本的选择方法及样本容量与重建精度密切相关,寻找一种高效的训练样本选择方法是光谱重建的目标之一。K均值聚类计算复杂度小,计算效率高,但因聚类初始值选择的随机性,以及离群点的影响致使聚类结果不稳定,... 光谱反射率重建过程中,训练样本的选择方法及样本容量与重建精度密切相关,寻找一种高效的训练样本选择方法是光谱重建的目标之一。K均值聚类计算复杂度小,计算效率高,但因聚类初始值选择的随机性,以及离群点的影响致使聚类结果不稳定,进而影响光谱重建的精度。基于此,提出了一种改进K均值聚类的训练样本选择方法。首先,将训练样本集的几何中心作为聚类中心的初始值;其次,基于高斯函数构建样本空间分布概率密度函数,并以欧几里德(欧式)距离作为其他聚类中心的度量依据;最后,在训练样本集中,基于簇内平方差度量光谱反射率样本间的相似度,将每个聚类子集中与中心距离最近的样本作为训练样本。为验证该方法的有效性,通过主成分分析法进行光谱重建。实验结果表明,所提的方法相较于传统的方法,光谱重建精度有一定的提高,重建光谱的平均均方根误差小于4%, CIE DE2000色差小于3.756 7。提出的改进的K均值聚类的训练样本选择方法,能够一定程度上提高了光谱重建精度,基本满足复制再现图像的要求。 展开更多
关键词 光谱重建 训练样本 算法 改进k均值
下载PDF
基于K-means聚类分析和多元线性回归的相关流量数据处理方法
5
作者 张李娜 姜志诚 +1 位作者 刘大勇 刘兴斌 《石油管材与仪器》 2024年第1期52-56,62,共6页
相关流量计在油井产出剖面测量中得到了成功的应用。但因传感器、调理电路以及流体本身噪声的影响,相关流量计所测量的渡越时间值会出现少量异常数据,使瞬时流速的计算结果与实际值相差很大,进而平均流量计算也出现较大的测量误差。对... 相关流量计在油井产出剖面测量中得到了成功的应用。但因传感器、调理电路以及流体本身噪声的影响,相关流量计所测量的渡越时间值会出现少量异常数据,使瞬时流速的计算结果与实际值相差很大,进而平均流量计算也出现较大的测量误差。对此提出基于K-means聚类算法对渡越时间样本数据聚类分析,并根据聚类结果建立多元线性回归预测模型,合理预测渡越时间值,以修正渡越时间的异常值。对预测值与实际值进行比较,最终获得准确的相关流量数据。采用多相流装置的实验数据对所建立的方法进行验证,结果表明,该方法可有效消除渡越时间的异常,优化流量测量的数据,对两相流流量测量有一定的实践意义。 展开更多
关键词 相关流量计 渡越时间 k均值算法 多元线性回归
下载PDF
基于Tukey规则与初始中心点优化的K⁃means聚类改进算法 被引量:2
6
作者 柳菁 邱紫滢 +1 位作者 郭茂祖 余冬华 《数据采集与处理》 CSCD 北大核心 2023年第3期643-651,共9页
针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,... 针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,在核心子集上执行中心点逐个递增优化选择策略,选出初始中心点。在来自UCI的20个数据集上聚类结果表明,本文提出的算法优于K⁃means++聚类算法,有效地提升了聚类性能。 展开更多
关键词 数据挖掘 k⁃means算法 Tukey规则 中心点优化
下载PDF
基于加权二分图的K均值最佳聚类数确定算法 被引量:1
7
作者 林伟杰 王勇 周林 《计算机工程与设计》 北大核心 2023年第4期1104-1111,共8页
针对传统K均值算法无法精确预设初始聚类中心数目的问题,提出基于加权二分图的K均值最佳聚类数确定算法。设计等比例随机采样的方式,从原始大数据集中产生小数据集集合并从中产生聚类中心点点集,提高应对大规模数据集的能力;用聚类中心... 针对传统K均值算法无法精确预设初始聚类中心数目的问题,提出基于加权二分图的K均值最佳聚类数确定算法。设计等比例随机采样的方式,从原始大数据集中产生小数据集集合并从中产生聚类中心点点集,提高应对大规模数据集的能力;用聚类中心点点集形成二分图,针对聚类算法特性改进其赋权函数;设计评价数,改进Kuhn-Munkres算法,将其用于求取二分图的最大权完美匹配,确定最佳聚类数。实验结果表明,相较其它6种对比算法,所提算法有更高的准确性,更好的稳定性,以及更强的处理大规模数据集能力。 展开更多
关键词 k均值 初始中心 随机采样 二分图 kuhn-Munkres算法 最佳 完美匹配
下载PDF
基于差分隐私保护的二分k均值聚类算法研究 被引量:1
8
作者 马文博 巫朝霞 《智能计算机与应用》 2023年第2期155-160,164,共7页
针对差分隐私保护k均值聚类算法(DP k-means)随机选取初始点,导致算法往往收敛于局部最优,进而影响聚类效果的问题,本文结合差分隐私的相关理论以及层次聚类的思想提出了一种基于差分隐私保护的二分k均值聚类算法(DP Bi-k-means)。首先... 针对差分隐私保护k均值聚类算法(DP k-means)随机选取初始点,导致算法往往收敛于局部最优,进而影响聚类效果的问题,本文结合差分隐私的相关理论以及层次聚类的思想提出了一种基于差分隐私保护的二分k均值聚类算法(DP Bi-k-means)。首先,以得到全局最优为目标,将随机选取初始点的过程进行改进,由上至下对目标数据集进行二分;其次,在迭代过程实现基于拉普拉斯机制的差分隐私保护。经安全性分析以及实验结果证明:该算法与传统差分隐私保护k均值算法(DP k-means)相比,可以避免聚类结果受初始点的影响陷入局部最优解,从而优化聚类效果,并为聚类分析提供了有效的隐私保护能力。 展开更多
关键词 差分隐私 二分k均值算法 拉普拉斯机制
下载PDF
基于K均值聚类算法的电气控制教学资源整合方法 被引量:1
9
作者 任亚婧 谷峥 刘温欣然 《信息与电脑》 2023年第13期251-253,共3页
为提升资源整合效率,提出基于K均值聚类算法的电气控制教学资源整合方法。通过模糊综合评价方式划分教学资源等级,建立电气控制教学资源库,基于K均值聚类算法整合资源库中的教学资源。实验结果表明,该方法可节省5~10 s的时间,能够加快... 为提升资源整合效率,提出基于K均值聚类算法的电气控制教学资源整合方法。通过模糊综合评价方式划分教学资源等级,建立电气控制教学资源库,基于K均值聚类算法整合资源库中的教学资源。实验结果表明,该方法可节省5~10 s的时间,能够加快资源整合的聚类速度。 展开更多
关键词 电气控制教学 k均值算法 教学资源整合 模糊综合评价
下载PDF
基于K均值聚类算法的景区旅游最佳路线定制
10
作者 张亚林 《电脑编程技巧与维护》 2023年第11期65-68,88,共5页
假期旅游时要去的景点很多,如何方便、快捷的到达每个景点。就需要一个将这些景点进行聚类的算法,以安排交通工具将不同游客送达这些聚类后的簇中心,然后游客自行到每个簇内景点。通过K均值聚类算法可以得到一条景区旅游最佳路线。
关键词 旅游 最佳路线 k均值算法
下载PDF
基于参数优化VMD和改进K聚类判据融合的配电网故障选线方法 被引量:1
11
作者 王建元 张宇辉 刘铖 《南方电网技术》 CSCD 北大核心 2023年第7期135-145,共11页
针对现有暂态量选线方法易受到故障相角、过渡电阻、噪声、谐波及判据阈值的影响,提出基于参数优化变分模态分解(variational mode decomposition,VMD)和改进K聚类判据融合的选线方法。首先对分解过程的3个关键性参数进行动态优化,利用... 针对现有暂态量选线方法易受到故障相角、过渡电阻、噪声、谐波及判据阈值的影响,提出基于参数优化变分模态分解(variational mode decomposition,VMD)和改进K聚类判据融合的选线方法。首先对分解过程的3个关键性参数进行动态优化,利用信号频谱及分量特性确定VMD分解层数,并以算术优化算法求取最佳惩罚因子,剔除了工频、噪声及谐波干扰,再根据分解层数与各模态频谱确定模态中心频率以提高分解效率。其次,以优化后的VMD获取余弦相似度、高频幅值和直流能量作为互补的故障选线判据值。最后以改进K聚类算法实现多判据融合,弥补了单一判据的局限性。理论分析、仿真与实测结果表明,所提方法适用于分布式电源接入的电网,不受故障位置、故障相角及过渡电阻的影响,具有优异的抗谐波与噪声干扰性能。 展开更多
关键词 故障选线 变分模态分解 算术优化算法 k中心点 抗噪性
下载PDF
K-means算法初始聚类中心选择的优化 被引量:48
12
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 k—means算法 初始中心 TDkM算法
下载PDF
空间聚类算法中的K值优化问题研究 被引量:39
13
作者 李永森 杨善林 +2 位作者 马溪骏 胡笑旋 陈增明 《系统仿真学报》 EI CAS CSCD 北大核心 2006年第3期573-576,共4页
在典型的空间聚类算法K-平均法和K-中心法中,K一般为用户事先确定的值,然而,实际中K值很难被精确地确定,往往表现为一个模糊的取值区间。在此提出距离代价函数的概念,建立了相应的数学模型并设计了一个新的K值优化算法,对空间聚类K值优... 在典型的空间聚类算法K-平均法和K-中心法中,K一般为用户事先确定的值,然而,实际中K值很难被精确地确定,往往表现为一个模糊的取值区间。在此提出距离代价函数的概念,建立了相应的数学模型并设计了一个新的K值优化算法,对空间聚类K值优化问题进行了初步的研究。 展开更多
关键词 空间 尽平均算法 距离代价函数 k值优化
下载PDF
基于改进人工蜂群算法的K均值聚类算法 被引量:49
14
作者 喻金平 郑杰 梅宏标 《计算机应用》 CSCD 北大核心 2014年第4期1065-1069,1088,共6页
针对K均值聚类(KMC)算法全局搜索能力差、初始聚类中心选择敏感,以及原始人工蜂群(ABC)算法的初始化随机性、易早熟、后期收敛速度慢等问题,提出了一种改进人工蜂群算法(IABC)。该算法利用最大最小距离积方法初始化蜂群,构造出适应KMC... 针对K均值聚类(KMC)算法全局搜索能力差、初始聚类中心选择敏感,以及原始人工蜂群(ABC)算法的初始化随机性、易早熟、后期收敛速度慢等问题,提出了一种改进人工蜂群算法(IABC)。该算法利用最大最小距离积方法初始化蜂群,构造出适应KMC算法的适应度函数以及一种基于全局引导的位置更新公式以提高迭代寻优过程的效率。将改进的人工蜂群算法与KMC算法结合提出IABC-Kmeans算法以改善聚类性能。通过Sphere、Rastrigin、Rosenbrock和Griewank四个标准测试函数和UCI标准数据集上进行测试的仿真实验表明,IABC算法收敛速度快,克服了原始算法易陷入局部最优解的缺点;IABC-Kmeans算法则具有更好的聚类质量和综合性能。 展开更多
关键词 人工蜂群算法 k均值算法 适应度函数 位置更新公式
下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:61
15
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 k—Means算法 初始中心 直方图 最优划分方法
下载PDF
一种半监督K均值多关系数据聚类算法 被引量:22
16
作者 高滢 刘大有 +1 位作者 齐红 刘赫 《软件学报》 EI CSCD 北大核心 2008年第11期2814-2821,共8页
提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系... 提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系信息.多关系数据库Movie上的实验结果验证了该算法的有效性. 展开更多
关键词 数据挖掘 半监督学习 算法 多关系数据 k均值
下载PDF
基于遗传算法的K均值聚类分析 被引量:70
17
作者 赖玉霞 刘建平 杨国兴 《计算机工程》 CAS CSCD 北大核心 2008年第20期200-202,共3页
传统K均值算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,容易陷入局部最优值。针对上述问题,该文提出一种基于遗传算法的K均值聚类算法,将K均值算法的局部寻优能力与遗传算法的全局寻优能力相结合,在自适应交叉概率和变异概... 传统K均值算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,容易陷入局部最优值。针对上述问题,该文提出一种基于遗传算法的K均值聚类算法,将K均值算法的局部寻优能力与遗传算法的全局寻优能力相结合,在自适应交叉概率和变异概率的遗传算法中引入K均值操作,以克服传统K均值算法的局部性和对初始中心的敏感性,实验证明,该算法有较好的全局收敛性,聚类效果更好。 展开更多
关键词 k均值算法 中心 遗传算法
下载PDF
初始中心优化的K-Means聚类算法 被引量:44
18
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 k—Means算法 初始中心 优化
下载PDF
二分K均值聚类算法优化及并行化研究 被引量:23
19
作者 张军伟 王念滨 +1 位作者 黄少滨 蔄世明 《计算机工程》 CAS CSCD 北大核心 2011年第17期23-25,共3页
二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均... 二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均匀划分的策略,对算法进行并行化处理。实验结果表明,改进后的算法能获得比较理想的加速比和较高的使用效率。 展开更多
关键词 数据挖掘 算法 二分k均值 并行化 群集系统
下载PDF
改进的二分K均值聚类算法 被引量:24
20
作者 刘广聪 黄婷婷 陈海南 《计算机应用与软件》 CSCD 2015年第2期261-263,277,共4页
K均值算法是一种常用的基于原型的聚类算法。但该算法要求用户随机选择初始质心,使得K均值算法受初始化影响较大。二分K均值算法虽然改善了这个问题,但仍然要求用户指定聚类个数,影响了聚类效果。用层次聚类对二分法进行改进,解决了二分... K均值算法是一种常用的基于原型的聚类算法。但该算法要求用户随机选择初始质心,使得K均值算法受初始化影响较大。二分K均值算法虽然改善了这个问题,但仍然要求用户指定聚类个数,影响了聚类效果。用层次聚类对二分法进行改进,解决了二分K均值算法受用户指定的聚类个数的影响的问题。并结合Chameleon算法,合并划分过细簇,优化聚类结果。仿真实验证明改进的聚类算法的抱团性和分离性优于二分K均值聚类算法。 展开更多
关键词 k均值 二分k均值 CHAMELEON算法 层次
下载PDF
上一页 1 2 34 下一页 到第
使用帮助 返回顶部