期刊文献+
共找到48篇文章
< 1 2 3 >
每页显示 20 50 100
基于约束满足的大数据聚类中心点确定仿真 被引量:5
1
作者 李沐春 贾宗维 《计算机仿真》 北大核心 2019年第9期410-413,共4页
针对传统的大数据聚类中心点确定方法存在用时较长、准确性较低等问题,提出了一种基于约束满足的大数据聚类中心点确定方法。将数据分布密度与增加数据关键点密度权值两种方法相结合,对大数据初始聚类中心进行K-means聚类,并获取最优聚... 针对传统的大数据聚类中心点确定方法存在用时较长、准确性较低等问题,提出了一种基于约束满足的大数据聚类中心点确定方法。将数据分布密度与增加数据关键点密度权值两种方法相结合,对大数据初始聚类中心进行K-means聚类,并获取最优聚类数目。通过最优聚类数目构建微型相似性矩阵,采用Gabow算法提取该矩阵所对应连通图的各个强连通分支。在强连通分支的基础之上,通过约束传播算法获取整个数据集的点对相似度,并利用点对相似度和奇异值分解确定大数据聚类中心点,实现数据聚类。实验结果表明,所提方法对具有更高的聚类准确性以及更低的聚类时间,适合海量数据的聚类应用。 展开更多
关键词 基于约束满足 大数据 聚类中心点确定
下载PDF
面向大规模数据精简的聚类中心点优化和FCM算法设计 被引量:5
2
作者 江文奇 黄容 +1 位作者 牟华伟 袁亚纯 《数学的实践与认识》 2021年第17期144-151,共8页
基于FCM的大规模数据聚类算法设计中,聚类中心点选择的迭代次数较多易于造成算法模型伸缩性不强、敏感性较弱和陷入局部最小值的难题.以大规模数据点精简算法设计为切入点,研究初始聚类中心点选择与FCM模型设计.首先,基于K近邻思想提出... 基于FCM的大规模数据聚类算法设计中,聚类中心点选择的迭代次数较多易于造成算法模型伸缩性不强、敏感性较弱和陷入局部最小值的难题.以大规模数据点精简算法设计为切入点,研究初始聚类中心点选择与FCM模型设计.首先,基于K近邻思想提出了数据点精简算法,获得精简之后的代表点集合.其次,兼顾原始数据点的稀疏程度和精简后代表点的分布特征,提出了基于密度的初始聚类中心点选取规则和具体步骤.再次,基于代表点集合和初始聚类中心点结果,给出了一种精简再融合的两阶段聚类算法.最后,运用仿真方法说明了本方法的有效性和优越性. 展开更多
关键词 算法 FCM 初始聚类中心点 K互近邻 数据精简
原文传递
基于K-中心点聚类的模糊航迹关联算法 被引量:6
3
作者 白浩 赵凯 +1 位作者 王越 薄拾 《计算机应用》 CSCD 北大核心 2015年第A01期310-312,共3页
为提高目标航迹相交和近距平行状态时航迹关联的正确率,提出了一种基于K-中心点聚类的模糊航迹关联算法。该算法基于K-中心点聚类算法,将系统航迹作为聚类中心,采用局部航迹与系统航迹关联的策略,为描述航迹间的相似性,采用模糊分析方法... 为提高目标航迹相交和近距平行状态时航迹关联的正确率,提出了一种基于K-中心点聚类的模糊航迹关联算法。该算法基于K-中心点聚类算法,将系统航迹作为聚类中心,采用局部航迹与系统航迹关联的策略,为描述航迹间的相似性,采用模糊分析方法,综合考虑各个因素的影响,构造模糊关联矩阵,并利用历史信息和先验知识进行航迹关联。仿真表明该算法在航迹相交状态下,相交时刻关联正确率比K-medoids聚类算法提高5%左右,近距平行状态下关联正确率的收敛速度优于K-medoids聚类算法。 展开更多
关键词 航迹关联 系统航迹 K-中心 模糊分析
下载PDF
基于免疫—中心点聚类算法的无功电压控制分区 被引量:35
4
作者 熊虎岗 程浩忠 孔涛 《电力系统自动化》 EI CSCD 北大核心 2007年第2期22-26,共5页
针对传统分区方法电气距离定义的缺点,提出一种新的电气距离即空间电气距离。依据系统中各节点之间无功电压变化关系,将系统各节点映射到一个多维空间中,节点之间的空间距离便是其电气距离,依据此距离将各节点进行归类,从而把无功电压... 针对传统分区方法电气距离定义的缺点,提出一种新的电气距离即空间电气距离。依据系统中各节点之间无功电压变化关系,将系统各节点映射到一个多维空间中,节点之间的空间距离便是其电气距离,依据此距离将各节点进行归类,从而把无功电压控制分区问题转化为数学上的空间聚类问题。针对无功电压控制分区的特点并借鉴聚类算法,提出免疫—中心点聚类的无功电压控制分区算法并将其运用于IEEE118节点系统,对分区结果进行分析并与其他算法结果比较,验证所提出的算法的准确性和可行性。 展开更多
关键词 无功电压控制分区 空间电气距离 免疫-中心算法 电力系统
下载PDF
基于k中心点聚类的图像二值化方法 被引量:10
5
作者 唐涛 覃晓 +1 位作者 易宗剑 韩冬越 《计算机科学与探索》 CSCD 北大核心 2015年第2期234-241,共8页
在机器视觉和模式识别的研究中,将图像变换为二值图像是能够更高效识别图像中的特定区域或者目标的关键。提出了一种基于k中心点聚类算法的图像二值化方法(image binarization k-medoids-based clustering,IBk MC)。该方法使用基于距离... 在机器视觉和模式识别的研究中,将图像变换为二值图像是能够更高效识别图像中的特定区域或者目标的关键。提出了一种基于k中心点聚类算法的图像二值化方法(image binarization k-medoids-based clustering,IBk MC)。该方法使用基于距离的平方和误差作为聚类质量度量,根据图像二值化的领域知识将k的值取为2,自然地将图像分为前景类和背景类两类。实验结果证明,针对复杂环境下的自然图像,该方法在效果和效率上优于OSTU(最大类间方差)阈值化方法。 展开更多
关键词 图像二值化 k中心 阈值
下载PDF
推进式优化特征权重的K-中心点聚类方法 被引量:1
6
作者 陈新泉 《计算机工程与应用》 CSCD 北大核心 2011年第29期175-181,204,共8页
为获得更贴近于混合属性数据点集空间的相异性度量,从而探测出数据点集的更有意义的聚类分布,提出了一种推进式优化特征权重的K-中心点聚类算法。对该聚类算法进行了必要的讨论,给出其时间复杂度分析及算法收敛性分析。为实现该聚类算... 为获得更贴近于混合属性数据点集空间的相异性度量,从而探测出数据点集的更有意义的聚类分布,提出了一种推进式优化特征权重的K-中心点聚类算法。对该聚类算法进行了必要的讨论,给出其时间复杂度分析及算法收敛性分析。为实现该聚类算法的特征权重优化步骤,给出了二种不同的特征权重优化方法和几个自适应优化距离权重系数、目标函数系数的方法。这些优化方法在一定的理论层次上解决了相异性度量的自适应优化问题。通过几个UCI标准数据集验证了该聚类算法有时能取得更好的聚类质量,从而说明该加权聚类算法具有一定的有效性。给出了几点研究展望,为下一步的研究指明了方向。 展开更多
关键词 相异性度量 K-中心 有序属性 无序属性 混合属性
下载PDF
动态粒度结合中心点算法在电力设备缺陷管控中的应用研究
7
作者 万少明 代金磊 《中国高新科技》 2024年第3期79-81,共3页
针对电力设备缺陷管控问题,文章研究提出了一种基于改进k-中心点聚类算法与动态粒度的电力设备缺陷管控模型。首先,利用改进的k-中心点聚类算法对设备缺陷数据进行聚类处理;然后,将动态粒度与改进算法进行结合,用于构建缺陷管控模型。... 针对电力设备缺陷管控问题,文章研究提出了一种基于改进k-中心点聚类算法与动态粒度的电力设备缺陷管控模型。首先,利用改进的k-中心点聚类算法对设备缺陷数据进行聚类处理;然后,将动态粒度与改进算法进行结合,用于构建缺陷管控模型。结果表明,缺陷管控模型的数据聚类正确率为93.07%,聚类效率能够达到90.07%,同时数据识别准确率、召回率和F1值分别为93.27%、93.52%和0.951,均优于对比方法。这说明研究构建的电力设备缺陷管控模型显著可以提高设备的可靠性和稳定性。 展开更多
关键词 动态粒度 k-中心算法 电力设备 缺陷管控
下载PDF
支持向量和多中心点:非线性聚类的两大方法
8
作者 王昌栋 赖剑煌 《数据挖掘》 2013年第4期41-49,共9页
作为数据挖掘的基础方法之一,数据聚类被广泛应用各个不同领域,例如计算机科学、医学、社会科学和经济学等。根据类的样本点的分布,数据聚类问题通常可以划分成线性可分聚类和非线性可分聚类。由于现实世界的数据分布流形的复杂性,非线... 作为数据挖掘的基础方法之一,数据聚类被广泛应用各个不同领域,例如计算机科学、医学、社会科学和经济学等。根据类的样本点的分布,数据聚类问题通常可以划分成线性可分聚类和非线性可分聚类。由于现实世界的数据分布流形的复杂性,非线性聚类是最流行和最被广泛研究的聚类问题之一。本文首先从四个角度对非线性聚类的近期工作做一个简要的综述,包括基于核的聚类算法、多中心点聚类算法、基于图的聚类算法以及基于支持向量的聚类算法。接着,我们将特别地介绍我们在非线性聚类研究方面的两个主要工作,分别是位置正则化的支持向量聚类(PSVC)以及多中心点近邻传播算法(MEAP)。我们将介绍这些方法的优势与局限性,同时指出未来的研究方向。 展开更多
关键词 非线性 中心 PSVC MEAP
下载PDF
基于K-中心点聚类算法的论坛信息识别技术研究 被引量:3
9
作者 王燕 吴灏 毛天宇 《计算机工程与设计》 CSCD 北大核心 2009年第1期210-212,共3页
提出了一种从非确定结构的论坛页面自动获取信息区域的方法。该方法在对K-中心点聚类算法的研究基础上克服了算法中固定簇数的缺陷,并在算法的簇中心距离计算中引入Smith-Waterman改进算法,提高了算法聚类的精确度。通过对大量论坛网页... 提出了一种从非确定结构的论坛页面自动获取信息区域的方法。该方法在对K-中心点聚类算法的研究基础上克服了算法中固定簇数的缺陷,并在算法的簇中心距离计算中引入Smith-Waterman改进算法,提高了算法聚类的精确度。通过对大量论坛网页进行信息识别的实验显示,该方法切实可行并且具有较高的准确性。 展开更多
关键词 标签结构树 K-中心算法 SMITH-WATERMAN算法 最小相异度 信息识别
下载PDF
基于线性回归分析的快速搜索聚类中心算法 被引量:4
10
作者 王星 呙鹏程 +1 位作者 王玉冰 程越 《系统工程与电子技术》 EI CSCD 北大核心 2017年第11期2614-2622,共9页
针对一种可快速搜索和寻找到聚类密度峰值点聚类算法的缺陷,利用线性回归与残差分析的方法进行改进,可自动、快速地确定聚类中心且优化样本点密度值。算法利用样本点的近邻信息重新度量点的密度值,提高聚类中心点位置稳定性;利用一元线... 针对一种可快速搜索和寻找到聚类密度峰值点聚类算法的缺陷,利用线性回归与残差分析的方法进行改进,可自动、快速地确定聚类中心且优化样本点密度值。算法利用样本点的近邻信息重新度量点的密度值,提高聚类中心点位置稳定性;利用一元线性回归与残差分析,快速、自动地选出聚类中心点,去除了人为选择的主观性。通过理论分析以及在人工数据集和真实数据集的对比实验表明,提出的基于线性回归分析的快速搜索聚类中心算法能够克服原有算法的缺陷,并且在聚类效果和计算时间上优于原有算法、基于密度的带有噪声的空间聚类算法(density based spatial clustering of applications with noise,DBSCAN)以及K-means算法。 展开更多
关键词 密度峰值 聚类中心点 线性回归 残差分析
下载PDF
2021年世界交通运输大会水运学部会议 基于改进K中心点聚类的船舶典型轨迹自适应挖掘算法 被引量:3
11
作者 李倍莹 张新宇 +2 位作者 沈忱 姚海元 齐越 《上海海事大学学报》 北大核心 2021年第3期15-22,共8页
针对目前船舶典型轨迹的挖掘多以轨迹段作为基本单元,导致聚类对象较为复杂且聚类参数难以确定的问题,本文提出一种基于改进K中心点聚类的船舶典型轨迹自适应挖掘算法。算法以轨迹点作为聚类对象,分析船舶的航速、航向特征并对轨迹点进... 针对目前船舶典型轨迹的挖掘多以轨迹段作为基本单元,导致聚类对象较为复杂且聚类参数难以确定的问题,本文提出一种基于改进K中心点聚类的船舶典型轨迹自适应挖掘算法。算法以轨迹点作为聚类对象,分析船舶的航速、航向特征并对轨迹点进行压缩;将分段均方根误差引入K中心点聚类算法,实现聚类参数的自适应选择;提取其中的聚类中心点作为轨迹特征点,得到不同类别船舶的典型轨迹。以天津港主航道船舶自动识别系统(automatic identification system,AIS)数据为例,基于地理信息系统平台ArcGIS实现聚类结果的可视化展示。实验结果表明,运用该算法得到的船舶典型轨迹与实际相符,自适应程度较高。研究结果对于辅助船舶轨迹异常检测及挖掘海上交通特征具有重要意义。 展开更多
关键词 海上交通数据挖掘 船舶典型轨迹 K中心 轨迹特征 自适应
下载PDF
正交小波变换k-中心点聚类算法在故障诊断中的应用 被引量:10
12
作者 李卫鹏 曹岩 李丽娟 《振动与冲击》 EI CSCD 北大核心 2021年第7期291-296,共6页
k-中心点聚类算法(k-medoids cluster algorithm,KCA)是改进的机器学习聚类算法,该方法通过初始聚类中心选取和聚类中心更新,对无标记训练样本的学习揭示数据的内在性质及规律,从而区分出机器的运行状态。提出了一种正交小波变换k-中心... k-中心点聚类算法(k-medoids cluster algorithm,KCA)是改进的机器学习聚类算法,该方法通过初始聚类中心选取和聚类中心更新,对无标记训练样本的学习揭示数据的内在性质及规律,从而区分出机器的运行状态。提出了一种正交小波变换k-中心点聚类算法(orthogonal wavelet transform k-medoids clustering algorithm,OWTKCA)诊断方法,利用正交小波变换(orthogonal wavelet transformation,OWT)方法提取各细节信号作为训练样本,用KCA方法进行分类。通过滚动轴承的试验数据分类结果显示,该方法相对于没有提取特征值的KCA能有效处理复杂机械振动信号,明显提高了故障数据聚类效果,缩短了聚类时间,提高了智能诊断效率。 展开更多
关键词 k-中心算法(KCA) 机器学习 故障诊断 正交小波变换(OWT)
下载PDF
基于k中心点聚类的稳态电能质量预警阈值研究 被引量:14
13
作者 刘建华 刘艳梅 +2 位作者 冯纯纯 李锦程 张屹修 《电测与仪表》 北大核心 2018年第23期41-45,共5页
对稳态电能质量预警阈值的研究是适应电能质量预警系统的开发。针对目前稳态电能质量预警阈值确定方法复杂单一的问题,提出了一种基于k中心点聚类的稳态电能质量阈值确定方法。该方法是在对电能质量数据进行聚类分析的基础上,使用基于... 对稳态电能质量预警阈值的研究是适应电能质量预警系统的开发。针对目前稳态电能质量预警阈值确定方法复杂单一的问题,提出了一种基于k中心点聚类的稳态电能质量阈值确定方法。该方法是在对电能质量数据进行聚类分析的基础上,使用基于距离的平方和误差作为聚类质量的度量,根据阈值确定的实际情况取k=2,自然地将所有数据分为正常类和异常类两类,在此基础上进行阈值的选取。实验结果证明,在确定电能质量阈值的问题上,该方法具有良好的效果和效率。 展开更多
关键词 电能质量 预警阈值 k中心
下载PDF
基于动态双子种群的差分进化K中心点聚类算法 被引量:2
14
作者 邓斌涛 徐胜超 《计算机与现代化》 2021年第7期54-59,70,共7页
随着海量大数据的出现,聚类算法需要新型计算模式来提高计算速度与运行效率。本文提出一种基于动态双子种群的差分进化K中心点聚类算法DGP-DE-K-mediods(Dynamic Gemini Population based DE-K-mediods)。DGP-DE-K-mediods利用动态双子... 随着海量大数据的出现,聚类算法需要新型计算模式来提高计算速度与运行效率。本文提出一种基于动态双子种群的差分进化K中心点聚类算法DGP-DE-K-mediods(Dynamic Gemini Population based DE-K-mediods)。DGP-DE-K-mediods利用动态双子种群方法,解决聚类算法在维持种群密度的时候避免陷入局部最优的问题;采用差分进化(Differential Evolution,DE)算法来提高全局最优能力的强健性;基于Hadoop云平台来并行处理DGP-DE-K-mediods,加快算法的运行速度和效率;描述基于MapReduce的并行聚类算法的编程过程;DGP-DE-K-mediods利用UIC的大数据分类的案例数据和网络入侵检测这种大数据应用来仿真算法的效果。实验结果表明,与已有的聚类算法相比,DGP-DE-K-mediods在检测精度、运行时间上有明显的优势。 展开更多
关键词 云计算 并行处理 K中心 差分进化 入侵检测系统
下载PDF
基于参数优化VMD和改进K聚类判据融合的配电网故障选线方法 被引量:5
15
作者 王建元 张宇辉 刘铖 《南方电网技术》 CSCD 北大核心 2023年第7期135-145,共11页
针对现有暂态量选线方法易受到故障相角、过渡电阻、噪声、谐波及判据阈值的影响,提出基于参数优化变分模态分解(variational mode decomposition,VMD)和改进K聚类判据融合的选线方法。首先对分解过程的3个关键性参数进行动态优化,利用... 针对现有暂态量选线方法易受到故障相角、过渡电阻、噪声、谐波及判据阈值的影响,提出基于参数优化变分模态分解(variational mode decomposition,VMD)和改进K聚类判据融合的选线方法。首先对分解过程的3个关键性参数进行动态优化,利用信号频谱及分量特性确定VMD分解层数,并以算术优化算法求取最佳惩罚因子,剔除了工频、噪声及谐波干扰,再根据分解层数与各模态频谱确定模态中心频率以提高分解效率。其次,以优化后的VMD获取余弦相似度、高频幅值和直流能量作为互补的故障选线判据值。最后以改进K聚类算法实现多判据融合,弥补了单一判据的局限性。理论分析、仿真与实测结果表明,所提方法适用于分布式电源接入的电网,不受故障位置、故障相角及过渡电阻的影响,具有优异的抗谐波与噪声干扰性能。 展开更多
关键词 故障选线 变分模态分解 算术优化算法 K中心 抗噪性
下载PDF
一种优化的K-Means聚类算法 被引量:3
16
作者 姚奥 张宇 《工业控制计算机》 2016年第11期120-121,124,共3页
聚类在数据挖掘领域应用广泛,但是传统的K-Means聚类算法存在对初始聚类中心点敏感以及需要人工设定聚类个数K等问题。针对这些问题,在进行评论文本特征词聚类的过程中,提出了一种改进的K-Means聚类算法,综合利用距离和密度来选择初始... 聚类在数据挖掘领域应用广泛,但是传统的K-Means聚类算法存在对初始聚类中心点敏感以及需要人工设定聚类个数K等问题。针对这些问题,在进行评论文本特征词聚类的过程中,提出了一种改进的K-Means聚类算法,综合利用距离和密度来选择初始聚类中心点,并利用评测标准来确定聚类的个数K。此外,在聚类过程中,提出了利用基于知网的相似度计算修正相似度矩阵,以及利用成对约束规则来提高聚类的准确度。实验证明,提出的方法是切实有效的。 展开更多
关键词 距离 密度 初始聚类中心点
下载PDF
基于PAM聚类的工业设计方案评价共识度达成方法 被引量:11
17
作者 杨延璞 顾蓉 古玉锋 《计算机集成制造系统》 EI CSCD 北大核心 2017年第7期1386-1393,共8页
为提高工业设计方案评价结果的可信度,建立了评价群体共识度模型,引入围绕中心点的划分聚类算法处理设计方案评价中的"少数意见",通过形成意见簇促进评价群体对设计方案的认知沟通,以加速意见收敛。研究了围绕中心点的划分聚... 为提高工业设计方案评价结果的可信度,建立了评价群体共识度模型,引入围绕中心点的划分聚类算法处理设计方案评价中的"少数意见",通过形成意见簇促进评价群体对设计方案的认知沟通,以加速意见收敛。研究了围绕中心点的划分聚类原理,提出基于围绕中心点的划分聚类的工业设计方案评价共识度达成流程,以户外检测车的设计方案评价为例,验证了该方法能够在共识度不一致时,通过围绕中心点的划分聚类识别"少数意见",促进评价群体间的交流沟通,实现共识度的达成。最后,通过与K-均值算法的聚类效果比较,显示了该方法的优越性。 展开更多
关键词 工业设计 设计方案评价 共识度 围绕中心的划分
下载PDF
一种有效的多关系聚类算法 被引量:1
18
作者 邓左祥 李春贵 《微电子学与计算机》 CSCD 北大核心 2016年第4期133-137,共5页
研究多关系数据挖掘的聚类问题,提出一种有效的多关系聚类算法EMC.EMC算法的目标是提高聚类的准确率,并且降低运行时间.EMC算法首先利用元组ID传播的思想,计算两个对象之间的相似度,接着利用K中心点聚类算法,将对象划分成簇.实验表明,EM... 研究多关系数据挖掘的聚类问题,提出一种有效的多关系聚类算法EMC.EMC算法的目标是提高聚类的准确率,并且降低运行时间.EMC算法首先利用元组ID传播的思想,计算两个对象之间的相似度,接着利用K中心点聚类算法,将对象划分成簇.实验表明,EMC算法显著降低运行时间,并且提高聚类的准确率. 展开更多
关键词 多关系数据挖掘 元组ID传播 相似度 K中心算法
下载PDF
基于k-medoids聚类算法的低压台区线损异常识别方法 被引量:7
19
作者 薛明志 陈商玥 高强 《天津理工大学学报》 2021年第1期26-31,共6页
针对低压台区线损异常情况的判断问题,以电力公司用电信息采集系统采集的日线损率数据为基础,提出了一种基于k-medoids聚类算法的低压台区线损异常识别方法,并以某地区819个台区为例进行算法可靠性的验证.首先应用局部异常因子LOF算法... 针对低压台区线损异常情况的判断问题,以电力公司用电信息采集系统采集的日线损率数据为基础,提出了一种基于k-medoids聚类算法的低压台区线损异常识别方法,并以某地区819个台区为例进行算法可靠性的验证.首先应用局部异常因子LOF算法对低压台区异常日线损率数据进行判断、筛选和剔除;其次应用k-medoids聚类算法对日线损率数据进行聚类分析,得到低压台区日线损率数据的聚类中心点和欧氏距离,从而实现低压台区线损异常情况的判断;最后通过819个低压台区的实际数据验证算法的合理性.结果表明,算法能够对低压台区线损的异常情况做出准确的判断. 展开更多
关键词 低压台区 k-medoids算法 局部异常因子LOF算法 日线损率 聚类中心点 欧氏距离
下载PDF
基于聚类的VSM模糊标引模式下文本检索问题研究 被引量:1
20
作者 刘海峰 张学仁 王倩 《工程地质计算机应用》 2007年第1期7-12,共6页
本文针对向量空间模型文本检索存在的几个问题进行了研究和探讨。在文本聚类模式下提出了特征项选取的改进方法;对TF-IDF因子提出了位置参数加权模式;对特征项标引问题引进模糊方式;对数据稀疏等问题总结了解决的方法。
关键词 模糊理论向量空间模型 位置加权 k-中心算法
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部