期刊文献+
共找到2,007篇文章
< 1 2 101 >
每页显示 20 50 100
增量式K-Medoids聚类算法 被引量:9
1
作者 高小梅 冯云 冯兴杰 《计算机工程》 CAS CSCD 北大核心 2005年第B07期181-183,共3页
聚类是一种非常有用的数据挖掘方法,可用于发现隐藏在数据背后的分组和数据分布信息。目前已经提出了许多聚类算法及其变种,但在增量式聚类算法研究方面所做的工作较少。当数据集因更新而发生变化时,数据挖掘的结果也应该进行相应的更... 聚类是一种非常有用的数据挖掘方法,可用于发现隐藏在数据背后的分组和数据分布信息。目前已经提出了许多聚类算法及其变种,但在增量式聚类算法研究方面所做的工作较少。当数据集因更新而发生变化时,数据挖掘的结果也应该进行相应的更新。由于数据量大,在更新后的数据集上重新执行聚类算法以更新挖掘结果显然比较低效,因此亟待研究增量式聚类算法。该文通过对K-Medoids聚类算法的改进,提出一种增量式K-Medoids聚类算法。它能够很好地解决传统聚类算法在伸缩性、数据定期更新时所面临的问题。 展开更多
关键词 数据挖掘 k—medoids聚类算法 最近邻 增量式算法
下载PDF
基于K-Medoids聚类的改进KNN文本分类算法 被引量:25
2
作者 罗贤锋 祝胜林 +1 位作者 陈泽健 袁玉强 《计算机工程与设计》 CSCD 北大核心 2014年第11期3864-3867,3937,共5页
为有效提高传统KNN算法(K最近邻算法)在海量数据的分类效率,分析传统KNN算法的分类过程,提出基于K-Medoids聚类的改进KNN算法。利用K-Medoids算法对文本训练集进行聚类,把文本训练集分成相似度较高的簇;根据待分类文本与簇的相对位置,... 为有效提高传统KNN算法(K最近邻算法)在海量数据的分类效率,分析传统KNN算法的分类过程,提出基于K-Medoids聚类的改进KNN算法。利用K-Medoids算法对文本训练集进行聚类,把文本训练集分成相似度较高的簇;根据待分类文本与簇的相对位置,对文本训练集进行裁剪,解决传统KNN算法在文本训练集过大时速度慢的问题。分析与实验结果表明,该裁剪方法能够合理有效地裁剪文本训练集,提高了KNN算法的运行效率和分类能力。 展开更多
关键词 文本分 隶属度 k最近邻 样本裁剪 k-medoids
下载PDF
基于遗传算法和k-medoids算法的聚类新算法 被引量:5
3
作者 郝占刚 王正欧 《现代图书情报技术》 CSSCI 北大核心 2006年第5期44-46,57,共4页
提出一种基于遗传算法和k-m edoids算法的新的聚类算法。指出该算法除能提高聚类的精度和识别孤立点外,还能加速遗传算法的收敛速度,节约时间成本。
关键词 遗传算法 k—medoids 算法
下载PDF
QPSO与K-Medoids相结合的带障碍空间聚类新算法 被引量:2
4
作者 杨腾飞 张雪萍 刘亚威 《电子设计工程》 2011年第2期74-77,80,共5页
分析了现有的带障碍约束空间聚类算法,针对基于PSO优化的带障碍约束的K-Medoids聚类分析方法的不足,提出了QPSO与K-Medoids算法结合的带障碍空间聚类新算法(QKSCO)。在带障碍约束的空间条件下,该算法依据蚁群格网障碍距离作为聚类依据,... 分析了现有的带障碍约束空间聚类算法,针对基于PSO优化的带障碍约束的K-Medoids聚类分析方法的不足,提出了QPSO与K-Medoids算法结合的带障碍空间聚类新算法(QKSCO)。在带障碍约束的空间条件下,该算法依据蚁群格网障碍距离作为聚类依据,引入了QPSO的快速全局收敛的特性,使之与K-Medoids算法的局部收敛特性相得益彰。实验结果表明该算法比PSO优化的带障碍约束的K-Medoids聚类算法更加稳定,聚类效果更好。 展开更多
关键词 空间 障碍约束 k—medoids算法 QPSO算法
下载PDF
基于快速K-medoids聚类的WLAN室内定位算法 被引量:3
5
作者 陶峥 宋强 金许烨 《电子设计工程》 2017年第6期109-113,共5页
在WLAN位置指纹定位技术中,K-means聚类算法一直被用于离线训练阶段的参考点聚类,文中针对该法对噪声数据和孤立点数据非常敏感等缺点,采用快速K-medoids聚类算法来对定位区域内的参考点进行聚类。快速K-medoids参考点聚类算法先选取初... 在WLAN位置指纹定位技术中,K-means聚类算法一直被用于离线训练阶段的参考点聚类,文中针对该法对噪声数据和孤立点数据非常敏感等缺点,采用快速K-medoids聚类算法来对定位区域内的参考点进行聚类。快速K-medoids参考点聚类算法先选取初始类中心参考点,再通过迭代方式在每一类中选取与其他位置指纹信息距离之和最小的那条位置指纹信息对应的参考点作为类中心参考点。最后通过实验数据分析表明,相比K-means参考点聚类算法,从平均误差、标准差和累积误差曲线图3个方面可以看出快速K-medoids参考点聚类算法在去除噪声数据和孤立点数据上具有更好的鲁棒性,可有效地提升定位精度。 展开更多
关键词 室内定位 无线局域网 位置指纹 算法 快速k中心点
下载PDF
基于交通拥堵信息的高速公路拥堵路段ACK-Means聚类
6
作者 陈昕 阮永娇 肇毓 《科学技术与工程》 北大核心 2024年第21期9194-9200,共7页
为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇... 为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇类密度、簇类间距以及簇类强度,同时又考虑到数据样本的偶然性,对离群点进行合理分配,ACK-Means算法可实现自适应确定聚类中心C和类别K值。基于实际交通拥堵信息构建数据集,Python编程实现高速公路拥堵路段ACK-Means聚类,巧妙解决了高速公路拥堵路段聚类数目K和聚类中心C设定问题。聚类结果表明,ACK-Means算法实现高速公路拥堵路段无监督聚类,聚类结果完全基于实际的高速公路交通拥堵信息,具有更高的实用性。 展开更多
关键词 交通拥堵 ACk-Means算法 自适应中心 自适应k 交通拥堵信息
下载PDF
基于二分K均值聚类算法的电子档案存储技术
7
作者 许德斌 《辽东学院学报(自然科学版)》 CAS 2024年第2期120-128,共9页
为实现电子档案高质量安全存储,提出基于二分K均值聚类算法的电子档案存储技术。由档案所有者挑选适合自己档案的存储机构,在存储机构工作人员帮助下,使用基于二分K均值聚类算法的图像优化方法优化待存储的电子档案。将优化后的电子档... 为实现电子档案高质量安全存储,提出基于二分K均值聚类算法的电子档案存储技术。由档案所有者挑选适合自己档案的存储机构,在存储机构工作人员帮助下,使用基于二分K均值聚类算法的图像优化方法优化待存储的电子档案。将优化后的电子档案发送给星际文件系统,由档案存储机构予以保存并返回唯一Hash指纹,操作完成后通过公钥密码算法实施数字签名操作,并由档案所有者对数字签名结果实施合理验证,验证通过后生成最终的电子档案及数字签名,发送给以太网区块链完成存储。实验结果表明,所提技术可较好存储电子档案,能够有效提升电子档案文件存储的安全性和稳定性,极大程度节省电子档案存储空间。 展开更多
关键词 k均值 电子档案 安全存储 区块链 星际文件系统 电子档案优化
下载PDF
基于再聚类和离散优化的k路划分算法
8
作者 潘萍梅 刘欣恬 +1 位作者 李兴权 朱文兴 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第3期473-484,共12页
为了寻得集成电路更优的k路划分,提出将再聚类和离散优化应用于k路划分算法.首先利用再聚类缩小超图规模,即根据给定划分计算顶点间的评级函数值,依据取值大小进行顶点聚类;然后将超图转换为星型图,并将k路划分问题转换为无约束的离散... 为了寻得集成电路更优的k路划分,提出将再聚类和离散优化应用于k路划分算法.首先利用再聚类缩小超图规模,即根据给定划分计算顶点间的评级函数值,依据取值大小进行顶点聚类;然后将超图转换为星型图,并将k路划分问题转换为无约束的离散优化问题;进而设计一个算法迭代移动增益值最大的顶点,在算法求解过程中放宽平衡约束,允许暂时处于不可行域的解,扩大问题的求解空间.在同一平台上使用ISPD98电路测试基准对所提算法、hMETIS-Kway和KaHyPar-K进行测试,并比较最小割值和运行时间.实验结果表明该算法优于hMETIS-Kway,特别是在k=2时,最小割值减少了0.173,速度提升了0.706.此外,该算法对KaHyPar-K也有相应的改进效果. 展开更多
关键词 k路划分 最小割 超图 离散优化
下载PDF
基于邻域互信息与K-means特征聚类的特征选择 被引量:1
9
作者 孙林 梁娜 徐久成 《智能系统学报》 CSCD 北大核心 2024年第4期983-996,共14页
针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为... 针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为自适应邻域半径,确定样本的邻域集,并由此构建自适应邻域熵、邻域互信息、归一化邻域互信息等度量,反映特征之间的相关性;然后,基于归一化邻域互信息构建自适应K近邻集合,利用Pearson相关系数表示特征的权重定义加权K近邻密度,实现自动选取K-means算法的簇中心,进而完成K-means特征聚类;最后,给出加权平均冗余度,选出每个特征簇中加权平均冗余度最大的特征构成最优特征子集。实验结果表明所提算法不仅可以有效提升特征选择的分类结果而且可以获得更好的聚类效果。 展开更多
关键词 特征选择 邻域互信息 k-MEANS 特征 自适应k近邻 特征权重 加权k近邻密度
下载PDF
用于雷达信号分选的K中位最近邻聚类算法
10
作者 伍佳钰 甄佳奇 《黑龙江大学自然科学学报》 CAS 2024年第4期496-504,共9页
在处理雷达信号时,基于密度的空间聚类(Density-based spatial clustering of applications with noise,DBSCAN)分选算法依赖于参数或阈值的选取,影响分选的准确率。为此提出了一种改进的雷达信号脉冲分选算法,在DBSCAN聚类基础上结合了... 在处理雷达信号时,基于密度的空间聚类(Density-based spatial clustering of applications with noise,DBSCAN)分选算法依赖于参数或阈值的选取,影响分选的准确率。为此提出了一种改进的雷达信号脉冲分选算法,在DBSCAN聚类基础上结合了K中位最近邻(K-median nearest neighbor,KMNN)算法,通过引入自衰减系数并设置阈值上限对参数值列表进行二次处理,可以自适应根据聚类结果与不同参数时的K值之间的关系确定最优的邻域半径和最少点个数,提高了分选的正确率。通过仿真实验验证了算法利用雷达脉冲描述字特征进行自适应分选的有效性。 展开更多
关键词 雷达信号分选 DBSCAN k中位最近邻算法
下载PDF
基于改进K均值聚类的光谱重建训练样本选择研究
11
作者 刘振 刘莉 +2 位作者 樊硕 赵安然 刘思鲁 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第1期29-35,共7页
光谱反射率重建过程中,训练样本的选择方法及样本容量与重建精度密切相关,寻找一种高效的训练样本选择方法是光谱重建的目标之一。K均值聚类计算复杂度小,计算效率高,但因聚类初始值选择的随机性,以及离群点的影响致使聚类结果不稳定,... 光谱反射率重建过程中,训练样本的选择方法及样本容量与重建精度密切相关,寻找一种高效的训练样本选择方法是光谱重建的目标之一。K均值聚类计算复杂度小,计算效率高,但因聚类初始值选择的随机性,以及离群点的影响致使聚类结果不稳定,进而影响光谱重建的精度。基于此,提出了一种改进K均值聚类的训练样本选择方法。首先,将训练样本集的几何中心作为聚类中心的初始值;其次,基于高斯函数构建样本空间分布概率密度函数,并以欧几里德(欧式)距离作为其他聚类中心的度量依据;最后,在训练样本集中,基于簇内平方差度量光谱反射率样本间的相似度,将每个聚类子集中与中心距离最近的样本作为训练样本。为验证该方法的有效性,通过主成分分析法进行光谱重建。实验结果表明,所提的方法相较于传统的方法,光谱重建精度有一定的提高,重建光谱的平均均方根误差小于4%, CIE DE2000色差小于3.756 7。提出的改进的K均值聚类的训练样本选择方法,能够一定程度上提高了光谱重建精度,基本满足复制再现图像的要求。 展开更多
关键词 光谱重建 训练样本 算法 改进k均值
下载PDF
基于K-means聚类分析和多元线性回归的相关流量数据处理方法
12
作者 张李娜 姜志诚 +1 位作者 刘大勇 刘兴斌 《石油管材与仪器》 2024年第1期52-56,62,共6页
相关流量计在油井产出剖面测量中得到了成功的应用。但因传感器、调理电路以及流体本身噪声的影响,相关流量计所测量的渡越时间值会出现少量异常数据,使瞬时流速的计算结果与实际值相差很大,进而平均流量计算也出现较大的测量误差。对... 相关流量计在油井产出剖面测量中得到了成功的应用。但因传感器、调理电路以及流体本身噪声的影响,相关流量计所测量的渡越时间值会出现少量异常数据,使瞬时流速的计算结果与实际值相差很大,进而平均流量计算也出现较大的测量误差。对此提出基于K-means聚类算法对渡越时间样本数据聚类分析,并根据聚类结果建立多元线性回归预测模型,合理预测渡越时间值,以修正渡越时间的异常值。对预测值与实际值进行比较,最终获得准确的相关流量数据。采用多相流装置的实验数据对所建立的方法进行验证,结果表明,该方法可有效消除渡越时间的异常,优化流量测量的数据,对两相流流量测量有一定的实践意义。 展开更多
关键词 相关流量计 渡越时间 k均值算法 多元线性回归
下载PDF
改进K均值聚类下铣床轴承沟道磨损检测研究
13
作者 睢雪亮 夏景攀 《自动化仪表》 CAS 2024年第10期80-85,共6页
针对铣床轴承沟道磨损检测精度较低的问题,提出改进K均值聚类下铣床轴承沟道磨损检测方法。通过UT372手持式光电速度仪与MPU-605压电加速度仪,采集铣床轴承沟道磨损数据。根据最远最近原则,初步选取数据集的聚类中心。使用欧氏距离计算... 针对铣床轴承沟道磨损检测精度较低的问题,提出改进K均值聚类下铣床轴承沟道磨损检测方法。通过UT372手持式光电速度仪与MPU-605压电加速度仪,采集铣床轴承沟道磨损数据。根据最远最近原则,初步选取数据集的聚类中心。使用欧氏距离计算出数据集各点间的距离与所有数据的平均距离,并结合交叉验证确定聚类中心的两个阈值。引入Canopy算法改进K均值聚类,确定全局最佳的聚类中心,从而实现铣床轴承沟道磨损的智能检测。试验结果表明,改进K均值聚类算法在铣床轴承沟道磨损检测中,迭代次数固定为15次、Jaccard系数极其接近1。该方法能够显著提升聚类的计算速度和稳定性,可识别不同铣床轴承沟道磨损故障类型,且检测精度高。 展开更多
关键词 铣床轴承 沟道磨损 k均值 Canopy算法 中心 欧氏距离 最远最近原则 交叉验证确定
下载PDF
基于改进K均值聚类的光伏板缺陷检测方法
14
作者 赵强 刘胜杰 +2 位作者 韩东成 刘常瑜 杨世植 《红外技术》 CSCD 北大核心 2024年第4期475-482,共8页
为了能够对光伏组件热斑部分准确地识别和提取,提出了一种基于HSV空间模型的改进K均值聚类图像处理方法。首先,将红外图像进行HSV空间转换和双边滤波处理,去除噪声并提高图像对比度;其次,使用高斯核函数估计实现图像灰度概率密度函数提... 为了能够对光伏组件热斑部分准确地识别和提取,提出了一种基于HSV空间模型的改进K均值聚类图像处理方法。首先,将红外图像进行HSV空间转换和双边滤波处理,去除噪声并提高图像对比度;其次,使用高斯核函数估计实现图像灰度概率密度函数提取,并以此获取初始聚类中心;最后,利用先验知识对图像进行K均值聚类,提取和量化热斑缺陷。研究结果表明,该方法能够快速地检测定位热斑位置并统计出光伏板损坏程度,具有较高的精度以及较好的灵敏性和稳定性。 展开更多
关键词 红外图像 缺陷检测 热斑 光伏板 HSV空间模型 改进k均值
下载PDF
基于改进K均值聚类算法的侦察数据分选方法研究
15
作者 胡华强 王喜 《软件》 2024年第9期4-6,共3页
由于电磁环境的复杂性,对侦察数据的分选是目标准确识别的前提,传统的基于信号特征的分选方法计算量大、分选结果不可靠,采用K均值聚类算法时,初始值的选择是难题。为改进K均值聚类算法,采用模拟退火和遗传算法相结合的方法对初始值和... 由于电磁环境的复杂性,对侦察数据的分选是目标准确识别的前提,传统的基于信号特征的分选方法计算量大、分选结果不可靠,采用K均值聚类算法时,初始值的选择是难题。为改进K均值聚类算法,采用模拟退火和遗传算法相结合的方法对初始值和聚类中心进行动态更新,仿真和试验结果表明分选结果准确可靠。 展开更多
关键词 k均值 算法 信号分选
下载PDF
基于k平面聚类的混合属性大数据模糊粒化方法
16
作者 昝超 《平顶山学院学报》 2024年第2期45-50,共6页
常规混合属性大数据模糊粒化多采用邻域互信息熵算法,但由于缺少对属性重要度的计算,导致数据粒化后的精简比较低,粒化质量不理想.为此,提出基于k平面聚类的混合属性大数据模糊粒化方法.根据多属性大数据序列模糊粒化的原理,利用时间序... 常规混合属性大数据模糊粒化多采用邻域互信息熵算法,但由于缺少对属性重要度的计算,导致数据粒化后的精简比较低,粒化质量不理想.为此,提出基于k平面聚类的混合属性大数据模糊粒化方法.根据多属性大数据序列模糊粒化的原理,利用时间序列分割方法将大数据进行分解,并将依赖性相似的属性看作一个信息粒,由此计算出单一属性的重要程度,从而完成对大数据的降维处理,结合k平面聚类算法对数据进行模态分解,以实现对数据的分块.基于此,计算数据的可约粒度区间,并在范围内实现对大数据的模糊粒化.实验结果显示,利用所提方法对混合属性大数据进行模糊粒化后,能够有效提高数据的精简比,粒化质量更好. 展开更多
关键词 k平面 混合属性大数据 模糊粒化 粒化质量
下载PDF
基于K均值聚类算法的谐振接地系统故障区段定位方法
17
作者 黄劼 汪逸帆 +2 位作者 林叶青 胡荔丹 王丹豪 《电气技术》 2024年第3期24-31,37,共9页
现有的谐振接地配电网单相接地故障定位方法存在通信依赖过度、特征分析复杂和阈值设置困难等问题,现场运行的适用性较低。本文基于深度融合智能开关在配电网中的应用,研究三相电流变化量的波形特征,提出基于K均值聚类算法的就地选段方... 现有的谐振接地配电网单相接地故障定位方法存在通信依赖过度、特征分析复杂和阈值设置困难等问题,现场运行的适用性较低。本文基于深度融合智能开关在配电网中的应用,研究三相电流变化量的波形特征,提出基于K均值聚类算法的就地选段方法。该方法提取各区段数据特征量,发挥K均值聚类算法无监督学习的优点,使各检测节点只需处理本地故障信号,从而减轻通信压力。利用仿真和现场数据验证该方法的可行性,结果表明,该方法在多种故障工况下都表现出较高的可靠性,并且能够较好地适应现场环境。 展开更多
关键词 谐振接地系统 单相接地故障 就地选段 k均值 非监督学习
下载PDF
基于相互K近邻的密度峰值聚类算法
18
作者 赵志忠 陈素根 《安庆师范大学学报(自然科学版)》 2024年第2期41-46,共6页
密度峰值聚类是一种原理简单、运行高效的聚类算法,但其存在密度定义方式不统一、聚类中心选择容易出错和样本分配可能产生“多米诺”现象等问题。针对上述问题,提出一种基于相互K近邻的密度峰值聚类算法(MKDPC)。首先,基于样本的相互K... 密度峰值聚类是一种原理简单、运行高效的聚类算法,但其存在密度定义方式不统一、聚类中心选择容易出错和样本分配可能产生“多米诺”现象等问题。针对上述问题,提出一种基于相互K近邻的密度峰值聚类算法(MKDPC)。首先,基于样本的相互K近邻定义一种改进的局部密度,统一了DPC算法密度定义方式,能够有效避免变密度数据集聚类中心选择出错的问题;其次,基于相互K近邻定义了样本间的共享相互K近邻和相似度,进而提出一种样本多步分配策略,该策略可以有效克服样本分配过程中的“多米诺”现象。在人工数据集和真实数据集上进行实验,并将MKDPC算法与其他4种算法进行比较,验证了所提MKDPC算法的有效性。 展开更多
关键词 密度峰值 相互k近邻 局部密度 分配策略
下载PDF
基于K均值聚类的智能变电站设备安全预警方法
19
作者 汪敏 张勇 《电气技术与经济》 2024年第9期274-276,280,共4页
智能变电站设备安全预警是确保电力系统运行稳定和设备可靠性的关键环节。本研究基于K均值聚类算法,提出了一种智能变电站设备安全预警方法。首先,通过数据采集和预处理获取设备数据集,并将其应用于K均值聚类分析。其次,通过建立预警模... 智能变电站设备安全预警是确保电力系统运行稳定和设备可靠性的关键环节。本研究基于K均值聚类算法,提出了一种智能变电站设备安全预警方法。首先,通过数据采集和预处理获取设备数据集,并将其应用于K均值聚类分析。其次,通过建立预警模型,识别异常点和安全风险。最后,通过识别结果实现安全预警。实验结果表明,基于K均值聚类的智能变电站设备安全预警方法能够提高变电站设备的安全性和稳定性,并为未来智能电力系统的发展奠定基础。 展开更多
关键词 k均值 智能变电站设备 安全预警 数据预处理
下载PDF
基于均值-标准差的K均值初始聚类中心选取算法 被引量:57
20
作者 张文君 顾行发 +2 位作者 陈良富 余涛 许华 《遥感学报》 EI CSCD 北大核心 2006年第5期715-721,共7页
遥感图像分类是遥感图像处理中长期存在的一个难题,针对不同的传感器图像,不同的应用需求,选择合适的分类算法非常重要。在分类中不仅要考虑分类的精度,而且要考虑分类效率。本文研究了K均值算法的初始聚类中心的选择对算法本身聚类精... 遥感图像分类是遥感图像处理中长期存在的一个难题,针对不同的传感器图像,不同的应用需求,选择合适的分类算法非常重要。在分类中不仅要考虑分类的精度,而且要考虑分类效率。本文研究了K均值算法的初始聚类中心的选择对算法本身聚类精度及效率的影响,提出了一种高效高精度的初始聚类中心选取方案,实验结果表明,利用该算法进行地表分类,效率比ENVI的K-M eans(K均值)模块高。 展开更多
关键词 遥感图像分 k均值
下载PDF
上一页 1 2 101 下一页 到第
使用帮助 返回顶部