期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
基于禁忌搜索的聚类簇数目估算算法 被引量:2
1
作者 刘勇国 张伟 +1 位作者 陈克非 廖晓峰 《计算机科学》 CSCD 北大核心 2005年第1期168-171,共4页
本文提出一种基于禁忌搜索的聚类算法,能自动估计数据集的正确的聚类簇数目,其数据对象既可是紧凑球型分布,也可是非紧凑球型分布,或皆具两者。该算法包括三个阶段:最小生成树聚类、聚类簇重组和禁忌搜素优化。实验结果表明,所提出的算... 本文提出一种基于禁忌搜索的聚类算法,能自动估计数据集的正确的聚类簇数目,其数据对象既可是紧凑球型分布,也可是非紧凑球型分布,或皆具两者。该算法包括三个阶段:最小生成树聚类、聚类簇重组和禁忌搜素优化。实验结果表明,所提出的算法可行、有效。 展开更多
关键词 禁忌搜索 算法 聚类簇数目 最小生成树 聚类簇重组 禁忌搜索优化
下载PDF
基于优化聚类簇后K-means算法的通用飞机售后保障方法
2
作者 陈超 吴晖 +1 位作者 万庆 王二振 《教练机》 2023年第4期52-56,共5页
随着通用飞机交付量的上升,售后质量安全保障的困难也在逐步上升,制造商难以用传统保障模式来服务用户。通过建立优化聚类簇的K-means模型,采用公开的全国通用机场经纬度数据,得到了通用飞机交付全国后的服务站点最佳数量与选址,并结合... 随着通用飞机交付量的上升,售后质量安全保障的困难也在逐步上升,制造商难以用传统保障模式来服务用户。通过建立优化聚类簇的K-means模型,采用公开的全国通用机场经纬度数据,得到了通用飞机交付全国后的服务站点最佳数量与选址,并结合我国国情验证了模型的鲁棒性,以及优化聚类簇后的K-means模型用于通用飞机服务站点选址的可行性。 展开更多
关键词 优化聚类簇 K-MEANS 售后保障
下载PDF
基于语义的中文文本聚类最佳簇数研究
3
作者 刘金岭 《计算机工程与设计》 CSCD 北大核心 2010年第9期2034-2036,2100,共4页
分析了聚类数目的确定对大样本数据聚类效果的影响,对目前聚类质量衡量指标的几个主要流行观点进行了剖析。利用文本相似度的概念对文本语义最佳聚类数问题进行了研究,提出了一种基于聚类过程的文本最佳聚类数算法CTBP,其主要思想是在... 分析了聚类数目的确定对大样本数据聚类效果的影响,对目前聚类质量衡量指标的几个主要流行观点进行了剖析。利用文本相似度的概念对文本语义最佳聚类数问题进行了研究,提出了一种基于聚类过程的文本最佳聚类数算法CTBP,其主要思想是在文本向量集的每个文本向量中抽取出一个词汇,按相似度有序排列,用增量逐层划分以得到最优划分所对应的簇类数。这样通过扫描一遍数据就可以获得多个统计信息,最后求出最优解。实验结果表明了该算法的高质量和高效率。 展开更多
关键词 文本 聚类簇 增量 划分 CTBP
下载PDF
基于联合熵的多视图集成聚类分析
4
作者 赵晓杰 牛雪莹 张继福 《计算机工程》 CAS CSCD 北大核心 2023年第10期112-119,共8页
多视图方法可使问题分析的角度更加全面,并且能有效利用各个视图间的相关信息和互补信息,因而多视图聚类分析已成为机器学习与模式识别等领域的研究热点之一。但在多视图集成聚类分析中,基聚类簇作为基聚类中的一个类簇,包含若干相似数... 多视图方法可使问题分析的角度更加全面,并且能有效利用各个视图间的相关信息和互补信息,因而多视图聚类分析已成为机器学习与模式识别等领域的研究热点之一。但在多视图集成聚类分析中,基聚类簇作为基聚类中的一个类簇,包含若干相似数据对象,其疏密程度仅能体现数据自身分布特性,并不能体现基聚类簇质量。利用联合熵来评估基聚类簇的不确定性及质量,提出一种多视图集成聚类分析方法。利用联合熵评估基聚类簇的质量,通过基聚类簇不确定性指数体现基聚类簇的重要程度与质量优劣。利用基聚类簇不确定性指数构造一种加权共协矩阵,提出一种多视图集成聚类算法(MVECJE),改善多视图集成聚类分析的性能。通过实验验证聚类簇权重在多视图集成聚类分析中的重要程度,表明其能改善集成聚类性能。在MSRC-v1、Caltech101-7、Handwritten numerals(HW)图像数据集和Reuters文本数据集上,采用CoregSC、AWGL、MMSC、DIMSC、COMVSC、MVKKM和CWK2M作为对比算法进行实验,结果表明,在NMI、ACC、ARI评价指标上,MVECJE算法具有明显的优势,其中在HW数据集上3个评价指标均高于0.93。 展开更多
关键词 多视图集成 聚类簇 权重 加权共协矩阵 联合熵
下载PDF
基于相似性的密度峰值聚类分析算法
5
作者 刘昱 胡立华 《计算机与数字工程》 2023年第6期1250-1255,共6页
密度峰值聚类是一类具有代表性的聚类分析方法,但针对复杂数据集时,其聚类效果较差。论文利用数据对象的近邻信息,提出了一种密度峰值聚类分析算法。该算法首先采用数据对象的K近邻,计算数据对象局部密度,并通过与其K近邻的密度和距离... 密度峰值聚类是一类具有代表性的聚类分析方法,但针对复杂数据集时,其聚类效果较差。论文利用数据对象的近邻信息,提出了一种密度峰值聚类分析算法。该算法首先采用数据对象的K近邻,计算数据对象局部密度,并通过与其K近邻的密度和距离的比值得到邻域密度比,重新定义了DPC密度计算方法,有效地解决了DPC截断距离dc在选择上的随意性;其次利用数据对象之间的相似性度量,结合影响空间、共享K近邻和密度比,给出了一种新的数据对象之间的相似性度量方法;然后利用数据对象的距离和密度相似的影响因素并与相似近邻结合,改进了FKNN-DPC分配策略。最后采用UCI数据集,实验验证了该算法具有良好的聚类簇效果。 展开更多
关键词 分析 密度峰值 相似性度量 聚类簇扩展 密度
下载PDF
非均匀类簇密度聚类的多粒度自学习算法 被引量:4
6
作者 曾华 吴耀华 黄顺亮 《系统工程与电子技术》 EI CSCD 北大核心 2010年第8期1760-1765,共6页
针对非均匀类簇密度聚类问题,从商空间粒度理论出发,提出一种多粒度自学习聚类算法(multi-granularity self-learning clustering algorithm,MSCA)。算法通过构造聚合树结构和定义粒度函数对问题逐层求解,并在每层聚合过程中根据聚合区... 针对非均匀类簇密度聚类问题,从商空间粒度理论出发,提出一种多粒度自学习聚类算法(multi-granularity self-learning clustering algorithm,MSCA)。算法通过构造聚合树结构和定义粒度函数对问题逐层求解,并在每层聚合过程中根据聚合区间以自学习的方式动态确定聚合粒度,解决了传统聚类算法从非均匀类簇密度数据中无法得到不同层次的聚合特征且参数对经验依赖性过高的问题。理论和实验表明,MSCA算法可以发现任意形状类簇,有效处理噪声,并能发现关键聚合层,具有较好的计算复杂性。 展开更多
关键词 数据挖掘 算法 非均匀密度 粒度计算 自学习算法
下载PDF
基于簇内数据聚类算法的WSNs故障检测方法 被引量:11
7
作者 宋佳 彭宇 +2 位作者 彭喜元 袁健博 葛子寒 《仪器仪表学报》 EI CAS CSCD 北大核心 2012年第10期2214-2219,共6页
能量是无线传感器网络应用中最宝贵的资源,由于节点能量消耗完毕死亡而导致网络瘫痪是一种典型故障。针对此故障形式提出了一种基于簇内数据聚类算法的故障检测技术,该方法利用无线传感器网络在按照地理位置进行分簇的基础上,通过采用... 能量是无线传感器网络应用中最宝贵的资源,由于节点能量消耗完毕死亡而导致网络瘫痪是一种典型故障。针对此故障形式提出了一种基于簇内数据聚类算法的故障检测技术,该方法利用无线传感器网络在按照地理位置进行分簇的基础上,通过采用数据聚类的方法,在能量不受限的汇节点处进行簇内数据再聚类,然后设置阈值进行故障检测。通过仿真实验证明,合理选择检测阈值,该方法在保持基于历史与邻居数据的节点自检测方法较高准确率的基础上,极大地减小了能量消耗,且明显降低了故障检测误警率。 展开更多
关键词 基于的故障检测技术 故障检测 无线传感器网络
下载PDF
基于移相加权球面单簇聚类的周期时间序列异常检测 被引量:2
8
作者 王骏 钟富礼 +1 位作者 王士同 邓赵红 《自动化学报》 EI CSCD 北大核心 2011年第8期984-992,共9页
针对传统的单分类器不适用于周期时间序列的异常检测,提出了一种基于移相加权球面单簇聚类的单分类器PS-WS1M-OCC.通过在聚类过程中增加高效的循环移位操作,解决了时间序列记录之间相似度计算的问题.另一方面,基于时间序列记录的权重分... 针对传统的单分类器不适用于周期时间序列的异常检测,提出了一种基于移相加权球面单簇聚类的单分类器PS-WS1M-OCC.通过在聚类过程中增加高效的循环移位操作,解决了时间序列记录之间相似度计算的问题.另一方面,基于时间序列记录的权重分布,提出了新的阈值自适应确定方法,从而使单分类器对训练集包含的异常数据和参数设置不敏感.实验表明,本文提出的单分类器可以用于周期时间序列的异常检测;与传统的单分类器相比,可以成功地从包含异常数据的训练集中进行无监督学习,对训练集包含的异常数据鲁棒,并且对参数不敏感. 展开更多
关键词 移相加权球面单 时间序列异常检测 单分 从包含噪声的数据中学习
下载PDF
基于区间数单簇聚类-单分类器的异常检测 被引量:1
9
作者 孙强 魏伟 +1 位作者 侯培鑫 岳继光 《计算机科学》 CSCD 北大核心 2017年第6期189-198,205,共11页
异常检测是系统运行维护的重要工作。在系统运行过程中可获得大量正常的运行数据,但异常数据的获取成本较高,因此可引入单分类器的思想来处理异常检测问题。测量不确定性、环境噪声、存储设备等导致监测数据可能存在不确定性。利用区间... 异常检测是系统运行维护的重要工作。在系统运行过程中可获得大量正常的运行数据,但异常数据的获取成本较高,因此可引入单分类器的思想来处理异常检测问题。测量不确定性、环境噪声、存储设备等导致监测数据可能存在不确定性。利用区间数描述不确定的监测数据,提出区间数样本的核可能性1-均值单簇聚类-单分类器异常检测算法。分别考虑聚类中心位于输入空间与特征空间两种情况,并考虑区间数样本具有的区间宽度不均衡性,提出区间细分检测策略。结合人工数据集与UCI数据集给出的算例验证了所提算法的有效性,其与现有SVM-OCC相比具有更高性能。 展开更多
关键词 区间数样本 单分 区间细分 异常检测
下载PDF
基于信息系统的零件簇聚类数确定方法
10
作者 张太华 李子毕 《机械设计与制造》 北大核心 2008年第4期189-190,共2页
首先给出一个基于聚类过程的零件簇分析模型,把信息知识表达系统引入到零件簇聚类分析中,建立聚类数与知识粒度的关系曲线,得出曲线拐点处所对应的零件簇聚类数即为零件簇的最佳分类数的结论。
关键词 零件 模型 信息系统 知识粒度
下载PDF
基于项目簇偏好的用户聚类算法
11
作者 刘芳先 李国 《现代计算机》 2013年第12期7-10,14,共5页
传统算法基于用户项目评分矩阵来进行推荐,存在冷开始、稀疏性等问题,邻居相似性只鉴于用户共同评价的项目,没有考虑项目本身的属性关系;在整个用户空间搜寻最近邻居,实时性差。针对这些问题,提出基于项目簇偏好的用户聚类算法,首先基... 传统算法基于用户项目评分矩阵来进行推荐,存在冷开始、稀疏性等问题,邻居相似性只鉴于用户共同评价的项目,没有考虑项目本身的属性关系;在整个用户空间搜寻最近邻居,实时性差。针对这些问题,提出基于项目簇偏好的用户聚类算法,首先基于项目属性特征对项目进行聚类,然后再利用用户对项目簇的偏好对用户进行聚类,最后在和目标用户最相似的几个聚类中搜寻邻居用户,从而压缩搜寻空间,提高了搜寻速度。实验表明,该算法通过降低稀疏性、冷开始等问题,增强实时性,提高预测精度。 展开更多
关键词 个性化推荐 协同过滤 基于特征属性的项目 基于项目偏好的用户
下载PDF
基于分簇聚类的云架构数据中心网络流量调度方法 被引量:1
12
作者 韩茂玲 《辽东学院学报(自然科学版)》 CAS 2021年第2期123-129,共7页
云架构数据中心网络流量具有种类繁杂的特点,应用传统的流量调度方法存在丢包率高、CPU利用率低的问题,为此利用分簇聚类技术实现对网络流量调度方法的设计。分别从控制层、核心层、聚合层、边缘层四个层级,搭建云架构数据中心网络的拓... 云架构数据中心网络流量具有种类繁杂的特点,应用传统的流量调度方法存在丢包率高、CPU利用率低的问题,为此利用分簇聚类技术实现对网络流量调度方法的设计。分别从控制层、核心层、聚合层、边缘层四个层级,搭建云架构数据中心网络的拓扑结构。检测云架构数据中心网络流量,并结合检测结果利用分簇聚类技术实现对网络流量的聚类处理。通过分配网络带宽、设置基本调度约束和流量分类调度控制三个步骤,实现数据中心网络流量调度。实验结果表明,该方法的丢包率降低了6.46%,且对CPU的利用率更高,可以有效提升云架构数据中心的数据传输效率。 展开更多
关键词 云架构 数据中心 网络流量调度
下载PDF
基于最小生成树的层次K-means聚类算法 被引量:17
13
作者 贾瑞玉 李振 《微电子学与计算机》 CSCD 北大核心 2016年第3期86-88,93,共4页
针对K-means算法初始化时需要指定聚类数目,和随机选择初始聚类中心对聚类结果产生不稳定的问题,结合图论中最小生成树和层次算法的分裂、凝聚思想,提出一种基于最小生成树的层次K-means算法.该算法初始时根据数据样本生成一颗最小生成... 针对K-means算法初始化时需要指定聚类数目,和随机选择初始聚类中心对聚类结果产生不稳定的问题,结合图论中最小生成树和层次算法的分裂、凝聚思想,提出一种基于最小生成树的层次K-means算法.该算法初始时根据数据样本生成一颗最小生成树,然后利用层次分裂思想把数据分成多个较小的簇,通过K-means算法迭代操作得到每次操作的评价函数值来判断是否进行簇的合并,进一步确定聚类簇数目.实验结果证明,该算法能够较准确地判断聚类数目,并且聚类结果的稳定性比基本K-means算法要好. 展开更多
关键词 K-MEANS算法 聚类簇 初始中心 层次结构 最小生成树 PRIM算法
下载PDF
基于混合蛙跳算法的K-mediods聚类挖掘与并行优化 被引量:1
14
作者 魏霖静 宁璐璐 +2 位作者 郭斌 侯振兴 甘诗润 《计算机科学》 CSCD 北大核心 2020年第10期126-129,共4页
为了降低K-mediods聚类算法的误差并提高并行优化的性能,将混合蛙跳算法运用于聚类和并行优化过程。在K-mediods聚类过程中,将K-mediods与聚类簇思想相结合,对各个聚类簇进行混合蛙跳算法优化,从而提高了大规模数据样本聚类的效率。针... 为了降低K-mediods聚类算法的误差并提高并行优化的性能,将混合蛙跳算法运用于聚类和并行优化过程。在K-mediods聚类过程中,将K-mediods与聚类簇思想相结合,对各个聚类簇进行混合蛙跳算法优化,从而提高了大规模数据样本聚类的效率。针对多个聚类执行节点并行完成大规模样本K-mediods聚类时,混合蛙跳算法有效提高了加速比。实验证明,相比于普通的K-mediods聚类,基于混合蛙跳算法的K-mediods聚类优势明显,且处理大规模样本的加速比性能更优。 展开更多
关键词 混合蛙跳算法 K-mediods 并行优化 聚类簇 加速比
下载PDF
基于类内K-means聚簇的KNN改进算法
15
作者 许奇功 郭洪 《木工机床》 2015年第4期20-22,26,共4页
传统的KNN算法的时间复杂度与训练样本集的数量成正比,大规模数据下其分类效率显著下降,因此它不适用于大规模数据的在线实时处理。为此,本文提出了一种基于类内K-means聚簇的KNN改进算法。该算法先对训练样本集内各个类别的样本分别进... 传统的KNN算法的时间复杂度与训练样本集的数量成正比,大规模数据下其分类效率显著下降,因此它不适用于大规模数据的在线实时处理。为此,本文提出了一种基于类内K-means聚簇的KNN改进算法。该算法先对训练样本集内各个类别的样本分别进行K-means聚簇,得到各个样本所属的簇标签,与各个簇标签所对应的簇中心向量。在进行KNN分类时对于每个测试样本先计算它与各个簇中心向量的相似度,选出排名前的一定个数的簇标签,随后以这些簇所含的样本集作为该测试样本的训练样本集进行传统的KNN分类。改进算法通过这种选择训练样本集而缩小了比对范围,减少了大量计算量。实验表明,改进的KNN分类算法在分类的准确率没有明显变动下,运行效率得到了明显的提升。 展开更多
关键词 KNN 算法
下载PDF
汉语文本聚类及其算法设计 被引量:3
16
作者 陈炯 范卓华 张虎 《山西电子技术》 2005年第2期29-30,45,共3页
主要针对传统的聚类算法倾向于识别大小类似的球形聚类簇,且对离群数据较为敏感等问题,利用聚类簇代表点选取的方法,同时结合基于人进行聚类判断所遵循的基本原则,即聚类中对象间距离应小于聚类间距离,设计了一种有效的聚类算法,实验结... 主要针对传统的聚类算法倾向于识别大小类似的球形聚类簇,且对离群数据较为敏感等问题,利用聚类簇代表点选取的方法,同时结合基于人进行聚类判断所遵循的基本原则,即聚类中对象间距离应小于聚类间距离,设计了一种有效的聚类算法,实验结果表明算法是有效的。 展开更多
关键词 代表点 聚类簇 中心 汉语文本 算法设计 分析法
下载PDF
基于分簇聚类的网络流量分类调度模型研究
17
作者 张创基 《电子测量技术》 2019年第12期86-89,共4页
为了提高云构架数据中心网络的流量预测能力,提出一种基于分簇聚类的网络流量分类调度模型。采用小波熵特征提取方法进行云构架数据中心网络流量预测,对云构架数据中心网络的流量数据进行了比特序列流模型构建,采用统计回归分析方法对... 为了提高云构架数据中心网络的流量预测能力,提出一种基于分簇聚类的网络流量分类调度模型。采用小波熵特征提取方法进行云构架数据中心网络流量预测,对云构架数据中心网络的流量数据进行了比特序列流模型构建,采用统计回归分析方法对云构架数据中心网络流量数据进行全样本分段线性规划分析,采用多尺度小波分解方法提取小波熵这一重要的非线性特征,根据特征提取结果采用分簇聚类方法进行流量分类调度,实现云构架数据中心网络的流量预测。仿真结果表明,采用该方法进行网络流量分类调度的均衡性较好,流量传输的丢包率较低,避免了网络拥堵。 展开更多
关键词 网络流量 调度 云构架 数据中心网络
下载PDF
一种基于双层迭代聚类分析的负荷模式可控精细化识别方法 被引量:35
18
作者 卜凡鹏 陈俊艺 +3 位作者 张琪祁 田世明 丁坚勇 朱炳翔 《电网技术》 EI CSCD 北大核心 2018年第3期903-910,共8页
提出一种基于双层迭代聚类分析的负荷模式可控精细化识别方法。首先以皮尔逊相关系数为相似性度量进行外层形态相似性聚类,然后分别对外层聚类得到的每一类簇以欧式距离为相似性度量进行内层幅度相近聚类。每层都先在给定的阈值约束下... 提出一种基于双层迭代聚类分析的负荷模式可控精细化识别方法。首先以皮尔逊相关系数为相似性度量进行外层形态相似性聚类,然后分别对外层聚类得到的每一类簇以欧式距离为相似性度量进行内层幅度相近聚类。每层都先在给定的阈值约束下迭代聚类,再对迭代收敛得到的聚类簇合并。实际算例分析结果表明:与传统负荷模式识别方法相比,所提方法改善了负荷形态聚类效果,可识别出形态相似但幅度不同的负荷,还能对聚类精细化程度进行控制,提高了聚类准确率。 展开更多
关键词 皮尔逊相关系数 欧式距离 双层迭代 阈值约束 聚类簇合并
下载PDF
基于Spark平台的K均值聚类算法的人力资源推荐 被引量:10
19
作者 李宇翔 李帅 +2 位作者 宋艳琼 张福泉 周湘贞 《济南大学学报(自然科学版)》 CAS 北大核心 2020年第5期430-435,共6页
为了提高人力资源推荐系统的效率,提出一种基于Spark平台的K均值聚类算法来完成人力资源推荐;Spark平台在分布式系统所有节点的内存弹性分布式数据集中完成聚类迭代运算,以加快聚类速度;将K均值聚类算法与聚类簇思想相结合,以提高大规... 为了提高人力资源推荐系统的效率,提出一种基于Spark平台的K均值聚类算法来完成人力资源推荐;Spark平台在分布式系统所有节点的内存弹性分布式数据集中完成聚类迭代运算,以加快聚类速度;将K均值聚类算法与聚类簇思想相结合,以提高大规模数据样本聚类的效率,得到聚类结果后,采用动态推荐算法实现人力资源实时推荐。结果表明,Spark平台相比于单机在聚类计算效率方面更有优势,且所提出的算法比单机的K均值聚类算法的聚类速度和准确率均更优,在动态推荐性能方面也优于常用推荐算法。 展开更多
关键词 Spark平台 人力资源推荐 K均值 聚类簇 动态推荐
下载PDF
基于模糊C均值聚类有效性的协同过滤算法 被引量:8
20
作者 葛林涛 徐桂琼 《计算机技术与发展》 2016年第1期22-26,32,共6页
针对电子商务系统中传统协同过滤算法普遍存在的稀疏性和扩展性问题,文中提出了基于模糊C均值聚类有效性的协同过滤算法。首先依据四种不同的聚类有效性函数确定合理的聚类数区间,并在合理聚类数区间中根据Xie-Beni方法搜寻得到最佳的... 针对电子商务系统中传统协同过滤算法普遍存在的稀疏性和扩展性问题,文中提出了基于模糊C均值聚类有效性的协同过滤算法。首先依据四种不同的聚类有效性函数确定合理的聚类数区间,并在合理聚类数区间中根据Xie-Beni方法搜寻得到最佳的聚类数,然后使用最佳聚类数对项目进行模糊C均值聚类,将用户对单个项目的偏好转化为对相似群组的偏好,将稀疏的用户-项目偏好信息构造成密集的用户-模糊类的偏好信息,最后在项目所属类别中寻找目标用户的最近邻并产生推荐。在数据集Movie Lens上与传统推荐算法相比的实验结果表明,新算法在平均绝对偏差、召回率、准确覆盖率等方面都有了较大改善,提高了推荐质量。 展开更多
关键词 协同过滤 模糊C均值算法 有效性函数 最佳聚类簇
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部