期刊文献+
共找到2,051篇文章
< 1 2 103 >
每页显示 20 50 100
基于交通拥堵信息的高速公路拥堵路段ACK-Means聚类
1
作者 陈昕 阮永娇 肇毓 《科学技术与工程》 北大核心 2024年第21期9194-9200,共7页
为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇... 为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇类密度、簇类间距以及簇类强度,同时又考虑到数据样本的偶然性,对离群点进行合理分配,ACK-Means算法可实现自适应确定聚类中心C和类别K值。基于实际交通拥堵信息构建数据集,Python编程实现高速公路拥堵路段ACK-Means聚类,巧妙解决了高速公路拥堵路段聚类数目K和聚类中心C设定问题。聚类结果表明,ACK-Means算法实现高速公路拥堵路段无监督聚类,聚类结果完全基于实际的高速公路交通拥堵信息,具有更高的实用性。 展开更多
关键词 交通拥堵 ACk-means算法 自适应中心 自适应k 交通拥堵信息
下载PDF
基于邻域互信息与K-means特征聚类的特征选择 被引量:1
2
作者 孙林 梁娜 徐久成 《智能系统学报》 CSCD 北大核心 2024年第4期983-996,共14页
针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为... 针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为自适应邻域半径,确定样本的邻域集,并由此构建自适应邻域熵、邻域互信息、归一化邻域互信息等度量,反映特征之间的相关性;然后,基于归一化邻域互信息构建自适应K近邻集合,利用Pearson相关系数表示特征的权重定义加权K近邻密度,实现自动选取K-means算法的簇中心,进而完成K-means特征聚类;最后,给出加权平均冗余度,选出每个特征簇中加权平均冗余度最大的特征构成最优特征子集。实验结果表明所提算法不仅可以有效提升特征选择的分类结果而且可以获得更好的聚类效果。 展开更多
关键词 特征选择 邻域互信息 k-means 特征 自适应k近邻 特征权重 加权k近邻密度
下载PDF
基于K-means聚类分析和多元线性回归的相关流量数据处理方法
3
作者 张李娜 姜志诚 +1 位作者 刘大勇 刘兴斌 《石油管材与仪器》 2024年第1期52-56,62,共6页
相关流量计在油井产出剖面测量中得到了成功的应用。但因传感器、调理电路以及流体本身噪声的影响,相关流量计所测量的渡越时间值会出现少量异常数据,使瞬时流速的计算结果与实际值相差很大,进而平均流量计算也出现较大的测量误差。对... 相关流量计在油井产出剖面测量中得到了成功的应用。但因传感器、调理电路以及流体本身噪声的影响,相关流量计所测量的渡越时间值会出现少量异常数据,使瞬时流速的计算结果与实际值相差很大,进而平均流量计算也出现较大的测量误差。对此提出基于K-means聚类算法对渡越时间样本数据聚类分析,并根据聚类结果建立多元线性回归预测模型,合理预测渡越时间值,以修正渡越时间的异常值。对预测值与实际值进行比较,最终获得准确的相关流量数据。采用多相流装置的实验数据对所建立的方法进行验证,结果表明,该方法可有效消除渡越时间的异常,优化流量测量的数据,对两相流流量测量有一定的实践意义。 展开更多
关键词 相关流量计 渡越时间 k均值算法 多元线性回归
下载PDF
基于反向K近邻和密度峰值初始化的加权Kmeans聚类入侵检测算法 被引量:6
4
作者 张喜梅 解滨 +1 位作者 徐童童 张春昊 《南京理工大学学报》 CAS CSCD 北大核心 2023年第1期56-65,共10页
传统Kmeans聚类算法的性能易受初始类簇中心随机性和类簇中心计算的迭代过程中边缘点和离群点反复计入的影响,为了避免这些影响,该文提出一种基于反向K近邻和密度峰值初始化的加权Kmeans聚类算法。通过样本的近邻信息计算每个样本的反向... 传统Kmeans聚类算法的性能易受初始类簇中心随机性和类簇中心计算的迭代过程中边缘点和离群点反复计入的影响,为了避免这些影响,该文提出一种基于反向K近邻和密度峰值初始化的加权Kmeans聚类算法。通过样本的近邻信息计算每个样本的反向K近邻,针对不同规模、不同密度分布数据集,可以自适应地搜索密度峰值点作为初始类簇中心;自适应设定相对簇半径,并通过样本加权进行类簇中心迭代,在不同数据分布下可以有效降低边缘点和离群点对聚类结果的影响。试验结果证明,该算法在聚类性能提升的同时迭代次数大幅降低,随着入侵行为类型和数据规模的增加,该文聚类算法仍体现出较好的性能,且在发现未知攻击类型上效果显著。 展开更多
关键词 kmeans 入侵检测 密度峰值 样本加权 反向k近邻
下载PDF
基于Tukey规则与初始中心点优化的K⁃means聚类改进算法 被引量:2
5
作者 柳菁 邱紫滢 +1 位作者 郭茂祖 余冬华 《数据采集与处理》 CSCD 北大核心 2023年第3期643-651,共9页
针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,... 针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,在核心子集上执行中心点逐个递增优化选择策略,选出初始中心点。在来自UCI的20个数据集上聚类结果表明,本文提出的算法优于K⁃means++聚类算法,有效地提升了聚类性能。 展开更多
关键词 数据挖掘 kmeans算法 Tukey规则 中心点优化
下载PDF
基于K-means聚类的GPS同步式欺骗识别方法 被引量:2
6
作者 王屹伟 路寅 +2 位作者 寇艳红 兰晓阳 黄智刚 《电子与信息学报》 EI CSCD 北大核心 2023年第11期4137-4149,共13页
针对进入GPS接收机的高隐蔽性同步式欺骗信号和真实卫星信号的区分问题,该文提出一种基于多重基带特征进行聚类分析的欺骗干扰识别方法。首先总结了抗同步式欺骗的基带处理流程;然后在欺骗检测和估计的基础上,在信号处理层级提取各个信... 针对进入GPS接收机的高隐蔽性同步式欺骗信号和真实卫星信号的区分问题,该文提出一种基于多重基带特征进行聚类分析的欺骗干扰识别方法。首先总结了抗同步式欺骗的基带处理流程;然后在欺骗检测和估计的基础上,在信号处理层级提取各个信号分量的伪码和载波多普勒频率一致性(CCDC)特征、相对幅度关系特征、载噪比异动特征,在信息解算层级提取各信号分量和其他信号分量相组合进行解算对应的伪距残差特征,以及欺骗入侵前后的钟差异动特征;最后利用K均值聚类(K-means)算法对不同特征进行综合,从而完成对欺骗信号的识别。基于射频(RF)信号采集回放的半实物实验及反欺骗软件接收机的处理结果表明,该方法能够及时而准确地识别同步式欺骗和真实信号,从而指导接收机抑制欺骗干扰并恢复正确的解算结果。 展开更多
关键词 GPS 同步式欺骗 抗欺骗 干扰识别 k均值
下载PDF
基于K-means聚类层次分析模型的中沙环礁地质环境稳定性定量分析 被引量:1
7
作者 覃茂刚 龙根元 +3 位作者 李海云 黄海波 陈万利 陈文 《热带海洋学报》 CAS CSCD 北大核心 2023年第2期113-123,共11页
中沙环礁位于中国南海的中心地带,是连接东沙、西沙和南沙群岛的重要枢纽。文章基于中沙环礁地形、地质采样、多道地震等调查数据,选取水深、沉积物类型、构造、滑坡易发区和坡度5个影响因子,采用K均值聚类算法(K-means)和层次分析法对... 中沙环礁位于中国南海的中心地带,是连接东沙、西沙和南沙群岛的重要枢纽。文章基于中沙环礁地形、地质采样、多道地震等调查数据,选取水深、沉积物类型、构造、滑坡易发区和坡度5个影响因子,采用K均值聚类算法(K-means)和层次分析法对中沙环礁的稳定性进行定量分析,将研究区划分为稳定性好、较好、中等、较差、差5个等级。分析了不同因子对中沙环礁稳定性的影响,其中沉积物类型、坡度和水深是影响台地稳定性的主要因素。台地周缘斜坡区稳定性主要受坡度、断裂构造和滑坡易发区等因素的控制,而台地周缘斜坡外深水区坡度因子贡献最大,整体上环礁北部和西部的稳定性优于东部和南部。环礁台地和台地周缘斜坡外深水区稳定性最好,越靠近台地斜坡稳定性逐渐变差,台地斜坡上缘区域稳定性最差。评价结果可为研究区的开发规划、海底管线工程建设及防灾减灾提供基础地质服务。 展开更多
关键词 中沙环礁 地质环境 稳定性 k均值算法
下载PDF
基于改进K-means的局部离群点检测方法
8
作者 周玉 夏浩 +1 位作者 岳学震 王培崇 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第4期66-77,共12页
离群点检测任务是指检测与正常数据在特征属性上存在显著差异的异常数据。大多数基于聚类的离群点检测方法主要从全局角度对数据集中的离群点进行检测,而对局部离群点的检测性能较弱。基于此,本文通过引入快速搜索和发现密度峰值方法改... 离群点检测任务是指检测与正常数据在特征属性上存在显著差异的异常数据。大多数基于聚类的离群点检测方法主要从全局角度对数据集中的离群点进行检测,而对局部离群点的检测性能较弱。基于此,本文通过引入快速搜索和发现密度峰值方法改进K-means聚类算法,提出了一种名为KLOD(local outlier detection based on improved K-means and least-squares methods)的局部离群点检测方法,以实现对局部离群点的精确检测。首先,利用快速搜索和发现密度峰值方法计算数据点的局部密度和相对距离,并将二者相乘得到γ值。其次,将γ值降序排序,利用肘部法则选择γ值最大的k个数据点作为K-means聚类算法的初始聚类中心。然后,通过K-means聚类算法将数据集聚类成k个簇,计算数据点在每个维度上的目标函数值并进行升序排列。接着,确定数据点的每个维度的离散程度并选择适当的拟合函数和拟合点,通过最小二乘法对升序排列的每个簇的每1维目标函数值进行函数拟合并求导,以获取变化率。最后,结合信息熵,将每个数据点的每个维度目标函数值乘以相应的变化率进行加权,得到最终的异常得分,并将异常值得分较高的top-n个数据点视为离群点。通过人工数据集和UCI数据集,对KLOD、LOF和KNN方法在准确度上进行仿真实验对比。结果表明KLOD方法相较于KNN和LOF方法具有更高的准确度。本文提出的KLOD方法能够有效改善K-means聚类算法的聚类效果,并且在局部离群点检测方面具有较好的精度和性能。 展开更多
关键词 离群点检测 k均值 最小二乘法 密度峰值 目标函数值
下载PDF
基于二分K均值聚类算法的电子档案存储技术
9
作者 许德斌 《辽东学院学报(自然科学版)》 CAS 2024年第2期120-128,共9页
为实现电子档案高质量安全存储,提出基于二分K均值聚类算法的电子档案存储技术。由档案所有者挑选适合自己档案的存储机构,在存储机构工作人员帮助下,使用基于二分K均值聚类算法的图像优化方法优化待存储的电子档案。将优化后的电子档... 为实现电子档案高质量安全存储,提出基于二分K均值聚类算法的电子档案存储技术。由档案所有者挑选适合自己档案的存储机构,在存储机构工作人员帮助下,使用基于二分K均值聚类算法的图像优化方法优化待存储的电子档案。将优化后的电子档案发送给星际文件系统,由档案存储机构予以保存并返回唯一Hash指纹,操作完成后通过公钥密码算法实施数字签名操作,并由档案所有者对数字签名结果实施合理验证,验证通过后生成最终的电子档案及数字签名,发送给以太网区块链完成存储。实验结果表明,所提技术可较好存储电子档案,能够有效提升电子档案文件存储的安全性和稳定性,极大程度节省电子档案存储空间。 展开更多
关键词 k均值 电子档案 安全存储 区块链 星际文件系统 电子档案优化
下载PDF
基于再聚类和离散优化的k路划分算法
10
作者 潘萍梅 刘欣恬 +1 位作者 李兴权 朱文兴 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第3期473-484,共12页
为了寻得集成电路更优的k路划分,提出将再聚类和离散优化应用于k路划分算法.首先利用再聚类缩小超图规模,即根据给定划分计算顶点间的评级函数值,依据取值大小进行顶点聚类;然后将超图转换为星型图,并将k路划分问题转换为无约束的离散... 为了寻得集成电路更优的k路划分,提出将再聚类和离散优化应用于k路划分算法.首先利用再聚类缩小超图规模,即根据给定划分计算顶点间的评级函数值,依据取值大小进行顶点聚类;然后将超图转换为星型图,并将k路划分问题转换为无约束的离散优化问题;进而设计一个算法迭代移动增益值最大的顶点,在算法求解过程中放宽平衡约束,允许暂时处于不可行域的解,扩大问题的求解空间.在同一平台上使用ISPD98电路测试基准对所提算法、hMETIS-Kway和KaHyPar-K进行测试,并比较最小割值和运行时间.实验结果表明该算法优于hMETIS-Kway,特别是在k=2时,最小割值减少了0.173,速度提升了0.706.此外,该算法对KaHyPar-K也有相应的改进效果. 展开更多
关键词 k路划分 最小割 超图 离散优化
下载PDF
用于雷达信号分选的K中位最近邻聚类算法
11
作者 伍佳钰 甄佳奇 《黑龙江大学自然科学学报》 CAS 2024年第4期496-504,共9页
在处理雷达信号时,基于密度的空间聚类(Density-based spatial clustering of applications with noise,DBSCAN)分选算法依赖于参数或阈值的选取,影响分选的准确率。为此提出了一种改进的雷达信号脉冲分选算法,在DBSCAN聚类基础上结合了... 在处理雷达信号时,基于密度的空间聚类(Density-based spatial clustering of applications with noise,DBSCAN)分选算法依赖于参数或阈值的选取,影响分选的准确率。为此提出了一种改进的雷达信号脉冲分选算法,在DBSCAN聚类基础上结合了K中位最近邻(K-median nearest neighbor,KMNN)算法,通过引入自衰减系数并设置阈值上限对参数值列表进行二次处理,可以自适应根据聚类结果与不同参数时的K值之间的关系确定最优的邻域半径和最少点个数,提高了分选的正确率。通过仿真实验验证了算法利用雷达脉冲描述字特征进行自适应分选的有效性。 展开更多
关键词 雷达信号分选 DBSCAN k中位最近邻算法
下载PDF
基于KMeans的MG-Y激光器准连续调谐方法
12
作者 张子娇 刘万泉 +2 位作者 张旭 吕峥 庄炜 《光通信研究》 北大核心 2024年第4期79-84,共6页
【目的】光纤光栅传感系统的光源为系统提供能量,稳定且连续的光源对于整个解调系统的应用至关重要。当将调制光栅Y分支(MG-Y)激光器作为光纤光栅解调系统的光源时,需解决MG-Y激光器难以在所需特定波长范围内快速获得稳定且连续的波长... 【目的】光纤光栅传感系统的光源为系统提供能量,稳定且连续的光源对于整个解调系统的应用至关重要。当将调制光栅Y分支(MG-Y)激光器作为光纤光栅解调系统的光源时,需解决MG-Y激光器难以在所需特定波长范围内快速获得稳定且连续的波长调谐问题。【方法】为实现MG-Y激光器快速获得稳定且连续的波长,文章提出了K均值(KMeans)聚类模型,并将其运用到MG-Y激光器快速获取高质量电流-波长查找表(LUT)的构建方法中。【结果】通过KMeans聚类模型方法结合MG-Y激光器调谐特性,可以快速获得构建LUT中相位调谐区域内最优调谐参数曲线的质心点,消耗时间约18.26 s,再依据MG-Y激光器自身的左、右和相位的调谐特性,采用均匀插值的方法来实现MG-Y激光器的波长精细调谐。使用KMeans聚类模型得到全调谐范围LUT,按照一定间隔筛选得到目标LUT。激光器按照该目标LUT下发命令的输出波长,实测波长的均值与目标波长的误差绝对值的均值为0.18 pm,误差绝对值的标准差为0.52 pm。从而可将MG-Y激光器作为光纤光栅传感系统的稳定光源来使用。【结论】经实验验证,传统的人工完成寻找每个相位调谐区域找到质心点的用时至少需要。30 min。通过KMeans聚类模型方法,完成同样操作,能大幅缩短寻找质心点的时间。并且通过该方法可控制MG-Y激光器实现输出准连续调谐的稳定波长。 展开更多
关键词 调制光栅Y分支激光器 k均值 连续调谐 查找表
下载PDF
基于KLPP-K-means-BiLSTM的台区短期电力负荷预测
13
作者 朱江 汪帆 +2 位作者 曹春堂 易灵芝 邹嘉乐 《电机与控制应用》 2024年第3期108-115,I0001,共9页
随着智能电网的发展,各场景的用电更加多元化,而准确的台区负荷预测是确保相关电力部门制定合适检修任务的关键,同时为有序用电、电网经济运行提供重要参考。为了挖掘台区负荷的特征以提高台区负荷预测的精度,提出了一种基于核主元分析... 随着智能电网的发展,各场景的用电更加多元化,而准确的台区负荷预测是确保相关电力部门制定合适检修任务的关键,同时为有序用电、电网经济运行提供重要参考。为了挖掘台区负荷的特征以提高台区负荷预测的精度,提出了一种基于核主元分析与局部保持投影降维、K均值聚类算法(K-means)以及双向长短时记忆网络(BiLSTM)的台区电力负荷预测方法。首先利用核局部保持投影(KLPP)对台区多特征负荷数据进行降维以提取主要特征信息;然后采取K-means聚类算法将相似特征的数据归类成各自的簇集;最后针对聚类后的各典型类型,有针对性地训练BiLSTM,并选取中国某高校低压台区负荷作为算例与其他经典预测方法进行对比分析,结果表明所提方法更拟合实际负荷走向,有效提升了预测效果。 展开更多
关键词 电力负荷预测 降维 k均值算法 双向长短时记忆网络 核局部保持投影
下载PDF
基于改进k-means算法的科研仪器机时智能计算系统
14
作者 李姜超 谢一航 +1 位作者 李辰 苏爽 《微型电脑应用》 2024年第10期156-160,共5页
传统的机时统计常使用人工,不仅效率低,而且成本相对较大,因此在传统的机时计算的基础上提出一种基于改进k均值聚类算法的科研仪器机时智能计算系统。通过对仪器机时电流数据的聚类分析,完成对仪器机时的计算和统计,同时将传统k均值聚... 传统的机时统计常使用人工,不仅效率低,而且成本相对较大,因此在传统的机时计算的基础上提出一种基于改进k均值聚类算法的科研仪器机时智能计算系统。通过对仪器机时电流数据的聚类分析,完成对仪器机时的计算和统计,同时将传统k均值聚类算法进行改进,提升其系统机时计算的准确性。结果表明,使用改进k均值聚类算法后的机时系统在仪器的机时计算中表现更为优异,计算的时间与正常运行时间相同,能够在一定程度上达到0误差标准。由此可见,使用改进聚类算法进行仪器的机时统计能够提升机时计算结果的准确性。 展开更多
关键词 仪器机时 k均值算法 智能 电流数据
下载PDF
基于改进PSO-KMeans煤炭异物筛选算法研究
15
作者 朱名乾 刘宾 《舰船电子工程》 2024年第2期35-39,共5页
采煤过程中异物自动识别和分拣是实现矿业信息化的关键技术之一。传统双能X射线系统根据R值算法可有效识别出煤炭中混杂的钢筋与胶皮,却难以识别与煤炭组成成分相似的木质杂质。针对这一问题,提出基于L_(0)范数最小化与改进PSO-KMeans... 采煤过程中异物自动识别和分拣是实现矿业信息化的关键技术之一。传统双能X射线系统根据R值算法可有效识别出煤炭中混杂的钢筋与胶皮,却难以识别与煤炭组成成分相似的木质杂质。针对这一问题,提出基于L_(0)范数最小化与改进PSO-KMeans的木质杂质筛选算法,借助L_(0)范数最小化算法平滑图像,去除煤灰干扰,利用改进PSO-KMeans聚类算法与基于距离变换的分水岭算法实现图像分割,根据离心率与矩形度进行木质杂质识别,并通过仿真实验验证方法的可行性。经验证此方法能有效筛选出煤炭中混杂的木质杂质。 展开更多
关键词 L_0范数最小化算法 粒子群优化算法 k均值算法 分水岭算法
下载PDF
基于改进K均值聚类的光谱重建训练样本选择研究
16
作者 刘振 刘莉 +2 位作者 樊硕 赵安然 刘思鲁 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第1期29-35,共7页
光谱反射率重建过程中,训练样本的选择方法及样本容量与重建精度密切相关,寻找一种高效的训练样本选择方法是光谱重建的目标之一。K均值聚类计算复杂度小,计算效率高,但因聚类初始值选择的随机性,以及离群点的影响致使聚类结果不稳定,... 光谱反射率重建过程中,训练样本的选择方法及样本容量与重建精度密切相关,寻找一种高效的训练样本选择方法是光谱重建的目标之一。K均值聚类计算复杂度小,计算效率高,但因聚类初始值选择的随机性,以及离群点的影响致使聚类结果不稳定,进而影响光谱重建的精度。基于此,提出了一种改进K均值聚类的训练样本选择方法。首先,将训练样本集的几何中心作为聚类中心的初始值;其次,基于高斯函数构建样本空间分布概率密度函数,并以欧几里德(欧式)距离作为其他聚类中心的度量依据;最后,在训练样本集中,基于簇内平方差度量光谱反射率样本间的相似度,将每个聚类子集中与中心距离最近的样本作为训练样本。为验证该方法的有效性,通过主成分分析法进行光谱重建。实验结果表明,所提的方法相较于传统的方法,光谱重建精度有一定的提高,重建光谱的平均均方根误差小于4%, CIE DE2000色差小于3.756 7。提出的改进的K均值聚类的训练样本选择方法,能够一定程度上提高了光谱重建精度,基本满足复制再现图像的要求。 展开更多
关键词 光谱重建 训练样本 算法 改进k均值
下载PDF
改进K均值聚类下铣床轴承沟道磨损检测研究
17
作者 睢雪亮 夏景攀 《自动化仪表》 CAS 2024年第10期80-85,共6页
针对铣床轴承沟道磨损检测精度较低的问题,提出改进K均值聚类下铣床轴承沟道磨损检测方法。通过UT372手持式光电速度仪与MPU-605压电加速度仪,采集铣床轴承沟道磨损数据。根据最远最近原则,初步选取数据集的聚类中心。使用欧氏距离计算... 针对铣床轴承沟道磨损检测精度较低的问题,提出改进K均值聚类下铣床轴承沟道磨损检测方法。通过UT372手持式光电速度仪与MPU-605压电加速度仪,采集铣床轴承沟道磨损数据。根据最远最近原则,初步选取数据集的聚类中心。使用欧氏距离计算出数据集各点间的距离与所有数据的平均距离,并结合交叉验证确定聚类中心的两个阈值。引入Canopy算法改进K均值聚类,确定全局最佳的聚类中心,从而实现铣床轴承沟道磨损的智能检测。试验结果表明,改进K均值聚类算法在铣床轴承沟道磨损检测中,迭代次数固定为15次、Jaccard系数极其接近1。该方法能够显著提升聚类的计算速度和稳定性,可识别不同铣床轴承沟道磨损故障类型,且检测精度高。 展开更多
关键词 铣床轴承 沟道磨损 k均值 Canopy算法 中心 欧氏距离 最远最近原则 交叉验证确定
下载PDF
基于改进K均值聚类的光伏板缺陷检测方法
18
作者 赵强 刘胜杰 +2 位作者 韩东成 刘常瑜 杨世植 《红外技术》 CSCD 北大核心 2024年第4期475-482,共8页
为了能够对光伏组件热斑部分准确地识别和提取,提出了一种基于HSV空间模型的改进K均值聚类图像处理方法。首先,将红外图像进行HSV空间转换和双边滤波处理,去除噪声并提高图像对比度;其次,使用高斯核函数估计实现图像灰度概率密度函数提... 为了能够对光伏组件热斑部分准确地识别和提取,提出了一种基于HSV空间模型的改进K均值聚类图像处理方法。首先,将红外图像进行HSV空间转换和双边滤波处理,去除噪声并提高图像对比度;其次,使用高斯核函数估计实现图像灰度概率密度函数提取,并以此获取初始聚类中心;最后,利用先验知识对图像进行K均值聚类,提取和量化热斑缺陷。研究结果表明,该方法能够快速地检测定位热斑位置并统计出光伏板损坏程度,具有较高的精度以及较好的灵敏性和稳定性。 展开更多
关键词 红外图像 缺陷检测 热斑 光伏板 HSV空间模型 改进k均值
下载PDF
初始中心优化的K-Means聚类算法 被引量:47
19
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 k—means算法 初始中心 优化
下载PDF
基于改进K-means聚类的在线新闻评论主题抽取 被引量:15
20
作者 夏火松 李保国 杨培 《情报学报》 CSSCI 北大核心 2016年第1期55-65,共11页
新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先... 新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先在预处理阶段增加同义词替换和自动构建领域词典的部分,改善了数据稀疏性和高维性。其次,提出了K-means改进算法,用隐藏长评论-最大距离法选初始点,解决了初始点多为离群点的问题,用方差拐点确定K值,解决了预先设定聚类个数的问题,实验发现了先用BW权重选初始点,再用新提出的BW-DF权重聚类的效果最好。最后,将改进算法与原算法的聚类效果比较,实验结果表明,改进算法准确率高,抽取新闻评论主题的效果明显。 展开更多
关键词 在线新闻评论 k—means改进 主题抽取 同义词替换 分词领域词典
下载PDF
上一页 1 2 103 下一页 到第
使用帮助 返回顶部