期刊文献+
共找到90篇文章
< 1 2 5 >
每页显示 20 50 100
Edge-Weighted Centroidal Voronoi Tessellations 被引量:2
1
作者 Jie Wang Xiaoqiang Wang 《Numerical Mathematics(Theory,Methods and Applications)》 SCIE 2010年第2期223-244,共22页
Most existing applications of centroidal Voronoi tessellations(CVTs) lack consideration of the length of the cluster boundaries.In this paper we propose a new model and algorithms to produce segmentations which would ... Most existing applications of centroidal Voronoi tessellations(CVTs) lack consideration of the length of the cluster boundaries.In this paper we propose a new model and algorithms to produce segmentations which would minimize the total energy—a sum of the classic CVT energy and the weighted length of cluster boundaries.To distinguish it with the classic CVTs,we call it an Edge-Weighted CVT(EWCVT).The concept of EWCVT is expected to build a mathematical base for all CVT related data classifications with requirement of smoothness of the cluster boundaries.The EWCVT method is easy in implementation,fast in computation,and natural for any number of clusters. 展开更多
关键词 centroidal Voronoi tessellations cluster boundaD edge detection clustering image processing.
下载PDF
基于聚类—重心法的连锁便利店配送中心选址研究
2
作者 杨健 沙伟东 《哈尔滨学院学报》 2024年第4期40-43,共4页
随着人民生活节奏的不断加快,便利店因其便利的属性而深受欢迎,其门店遍布各大小区和繁华地段。大量的门店给商家带来极大的仓储运输压力,因此建立一套新的物流配送系统,并据此系统建立选址模型是必要的。模型首先使用聚类算法得出中转... 随着人民生活节奏的不断加快,便利店因其便利的属性而深受欢迎,其门店遍布各大小区和繁华地段。大量的门店给商家带来极大的仓储运输压力,因此建立一套新的物流配送系统,并据此系统建立选址模型是必要的。模型首先使用聚类算法得出中转中心地址,再由聚类出的中转中心地址通过重心法得到总配送中心地址。该模型简单便捷易操作,能有效降低运输成本,提升运输效率。 展开更多
关键词 物流配送系统 聚类算法 重心法
下载PDF
嘉陵江流域骤发干旱时空演变特征分析 被引量:1
3
作者 孟长青 董子娇 +3 位作者 刘柯莹 王远坤 张验科 钟德钰 《水利水电科技进展》 CSCD 北大核心 2024年第4期23-30,58,共9页
为探究嘉陵江流域骤发干旱可识别特性与时空演变特征,基于标准化蒸发胁迫比研究了1980—2020年嘉陵江流域骤发干旱的时空分布特征,通过密度聚类算法提取骤发干旱斑块分析了斑块质心的轨迹变化,并探讨了骤发干旱暴发初期气象要素的异常... 为探究嘉陵江流域骤发干旱可识别特性与时空演变特征,基于标准化蒸发胁迫比研究了1980—2020年嘉陵江流域骤发干旱的时空分布特征,通过密度聚类算法提取骤发干旱斑块分析了斑块质心的轨迹变化,并探讨了骤发干旱暴发初期气象要素的异常情况。结果表明:流域西北部骤发干旱强度更高且发展速度更快,流域南部骤发干旱持续时间更长;流域骤发干旱事件主要发生在4—11月,且骤发干旱事件的质心主要沿东北和西北方向迁移;嘉陵江流域的骤发干旱主要由高温和降水共同主导。 展开更多
关键词 骤发干旱 标准化蒸发胁迫比 密度聚类算法 质心迁移 时空演变 嘉陵江流域
下载PDF
考虑综合相似性度量的光伏典型出力场景聚类方法
4
作者 程雄 戴鹏 +2 位作者 钟浩 李咸善 李文武 《中国电机工程学报》 EI CSCD 北大核心 2024年第21期8462-8474,I0011,共14页
场景聚类是描述不确定性光伏典型出力特性的有效途径之一,如何度量波动繁杂的光伏发电曲线相似性以及生成具有代表性的光伏出力场景是目前亟需解决的问题。为此,提出一种考虑综合相似性度量的光伏典型出力场景聚类方法,其基本思路是首... 场景聚类是描述不确定性光伏典型出力特性的有效途径之一,如何度量波动繁杂的光伏发电曲线相似性以及生成具有代表性的光伏出力场景是目前亟需解决的问题。为此,提出一种考虑综合相似性度量的光伏典型出力场景聚类方法,其基本思路是首先考虑光伏发电的电量大小、形态趋势、波动位置相似性,得到适用于光伏发电曲线的综合相似性度量距离;其次将形态质心作为优化问题求解,再用同倍比放大法得到兼顾电量和形态的实际质心,针对传统聚类算法在初始中心确定等方面的不足,以二十四节气为区间提出基于改进K-means算法的光伏典型场景集生成模型;最后构建光伏发电场景集指标评价体系,以熵权Topsis法对典型出力场景集进行综合评价。云南某地装机50MW的光伏电站2018—2020年算例结果表明:该文算法能准确划分和提取典型光伏出力场景,且以节气为区间生成的典型场景集在波动和电量指标上都有较好的表现,证明算法的有效性。 展开更多
关键词 相似性度量 聚类质心提取 光伏场景生成 典型场景集评价 K-MEANS算法
下载PDF
一种面向大规模资源发现的分布式局部聚类方法
5
作者 孟新宇 潘文宇 马艺宁 《数据采集与处理》 CSCD 北大核心 2024年第1期215-222,共8页
在大规模资源环境下,传统的资源索引机制导致Peer结点数量急剧增加和负载均衡性能下降,影响查询效率和系统稳定性。本文提出了一种质心模型的局部资源聚类方法,通过将相近资源聚类于单一结点并选出代表性键,有效减少了P2P(Peer-to-peer... 在大规模资源环境下,传统的资源索引机制导致Peer结点数量急剧增加和负载均衡性能下降,影响查询效率和系统稳定性。本文提出了一种质心模型的局部资源聚类方法,通过将相近资源聚类于单一结点并选出代表性键,有效减少了P2P(Peer-to-peer)网络中的Peer结点规模。此外,局部聚类机制集中处理距离相近的键,避免了资源覆盖的过度膨胀。实验结果显示,基于质心模型的Skip Graph算法不仅降低了查询复杂度,提高了负载均衡性能,而且在网络规模、数据量及查询复杂度方面展现出优秀的扩展性,更好地适应大规模资源发现的需求。 展开更多
关键词 局部聚类 资源发现 P2P网络 质心模型
下载PDF
高维数据聚类数量可视化确定模式
6
作者 何选森 何帆 +1 位作者 樊跃平 陈洪军 《沈阳航空航天大学学报》 2024年第3期71-84,共14页
为了解决经典K-均值聚类算法要求用户事先知道待处理数据的聚类数量及聚类结果对算法的初始化很敏感的问题,提出一种对K-均值聚类算法的改进措施并可视化地确定聚类数量的综合方案。首先,对数据进行标准化,使其服从正态分布,利用主分量... 为了解决经典K-均值聚类算法要求用户事先知道待处理数据的聚类数量及聚类结果对算法的初始化很敏感的问题,提出一种对K-均值聚类算法的改进措施并可视化地确定聚类数量的综合方案。首先,对数据进行标准化,使其服从正态分布,利用主分量分析(princi‐palcomponentanalysis,PCA)抽取数据中最重要的特征以实现高维数据的降维;然后,采用最远质心选择和最小-最大距离规则对K-均值聚类算法的初始化进行修正,避免出现空聚类并确保数据的可分离性;在此基础上,采用统计经验法则估计聚类数量的可能范围,通过搜索在此范围内平方误差和(sum-of-squared-error,SSE)曲线的肘部估计最佳的聚类数量;最后,通过计算比较各个聚类的轮廓系数以评价算法的聚类质量,从而最终确定数据集固有的聚类数量。仿真结果表明,该方案不仅能可视化地确定数据集潜在的聚类数量,而且为大数据时代的高维数据分析提供了一种有效的方法。 展开更多
关键词 K-均值聚类算法 主分量分析 最远质心选择 最小-最大距离规则 统计经验法则 肘部法 轮廓分析
下载PDF
面向大数据处理的划分聚类新方法 被引量:22
7
作者 卢志茂 冯进玫 +2 位作者 范冬梅 杨朋 田野 《系统工程与电子技术》 EI CSCD 北大核心 2014年第5期1010-1015,共6页
大数据处理是物联网研究和应用上不可回避的难题之一,针对常用聚类方法在大数据处理上的不足,设计了一种划分聚类新方法。该方法采用了大数据集的抽样技术,对多次抽取的规模足够大的样本进行聚类以确定自然簇质心的初始位置,在此基础上... 大数据处理是物联网研究和应用上不可回避的难题之一,针对常用聚类方法在大数据处理上的不足,设计了一种划分聚类新方法。该方法采用了大数据集的抽样技术,对多次抽取的规模足够大的样本进行聚类以确定自然簇质心的初始位置,在此基础上采用抽样后剩余数据样本对质心的初始位置进行更新,以便校正偏离理想位置的初始质心。该划分聚类算法具有线性空间复杂度和时间复杂度。实验结果表明所提的新聚类算法不仅能得到比常用聚类算法更理想的结果,而且运行速度快,适合处理大规模数据的聚类任务。 展开更多
关键词 大数据 物联网 划分聚类 抽样 质心
下载PDF
基于QPSO的数据聚类 被引量:14
8
作者 龙海侠 须文波 孙俊 《计算机应用研究》 CSCD 北大核心 2006年第12期40-42,45,共4页
在K-Means聚类、PSO聚类、K-Means和PSO混合聚类(KPSO)的基础上,研究了基于量子行为的微粒群优化算法(QPSO)的数据聚类方法,并提出利用K-Means聚类的结果重新初始化粒子群,结合QPSO的聚类算法,即KQPSO。介绍了如何利用上述算法找到用户... 在K-Means聚类、PSO聚类、K-Means和PSO混合聚类(KPSO)的基础上,研究了基于量子行为的微粒群优化算法(QPSO)的数据聚类方法,并提出利用K-Means聚类的结果重新初始化粒子群,结合QPSO的聚类算法,即KQPSO。介绍了如何利用上述算法找到用户指定的聚类个数的聚类中心。聚类过程都是根据数据之间的Euclidean(欧几里得)距离。K-Means算法、PSO算法和QPSO算法的不同在于聚类中心向量的“进化”上。最后使用三个数据集比较了上面提到的五种聚类方法的性能,结果显示基于QPSO算法的数据聚类性能比一般PSO算法更好。 展开更多
关键词 聚类 K—Means PSO QPSO 聚类中心
下载PDF
一种基于PSO的模糊聚类算法 被引量:9
9
作者 冯征 阎敏 张智峰 《计算机工程与应用》 CSCD 北大核心 2006年第27期150-151,165,共3页
在大量的模糊聚类算法中,模糊C均值聚类算法是应用最为广泛的,然而它存在着一些缺点:对初始值敏感,对噪声数据敏感,容易陷入局部最优。针对以上问题,提出了一种基于粒子群优化的模糊聚类算法,利用粒子群强大的全局寻优能力,这种算法克... 在大量的模糊聚类算法中,模糊C均值聚类算法是应用最为广泛的,然而它存在着一些缺点:对初始值敏感,对噪声数据敏感,容易陷入局部最优。针对以上问题,提出了一种基于粒子群优化的模糊聚类算法,利用粒子群强大的全局寻优能力,这种算法克服了模糊C均值聚类算法的缺点,试验证明,这种算法是一种很有潜力的模糊聚类算法。 展开更多
关键词 粒子群优化 模糊聚类 模糊C均值算法 簇中心
下载PDF
基于全局性确定聚类中心的文本聚类 被引量:5
10
作者 陈建超 胡桂武 +1 位作者 杨志华 严桂夺 《计算机工程与应用》 CSCD 北大核心 2011年第10期147-150,共4页
文本聚类关键是有效解决特征词向量选择及特征词权重计算方法、文本相似度计算方法、聚类中心确定等三个问题。针对相关算法在三个关键环节上存在的问题,提出了适合自由文本特点的特征词权重计算方法和文本相似度计算方法;在此基础上提... 文本聚类关键是有效解决特征词向量选择及特征词权重计算方法、文本相似度计算方法、聚类中心确定等三个问题。针对相关算法在三个关键环节上存在的问题,提出了适合自由文本特点的特征词权重计算方法和文本相似度计算方法;在此基础上提出了改进的CBC算法,从全局上自适应地确定文本集中的各个聚类中心。算法在实验中准确地确定了各个聚类中心,并在两个文本集上分别获得88.50%和94.00%的聚类准确率。 展开更多
关键词 文本聚类 全局性 聚类质心 特征词集
下载PDF
基于最小聚类划分的K-means聚类(1+ε)近似算法 被引量:5
11
作者 王守强 朱大铭 史士英 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期26-30,共5页
k-means聚类算法是解决聚类问题的一个常用方法.近年来,国外许多学者对该问题的近似常数算法和(1+ε)近似算法进行了研究.利用Kumar等人随机取样技术对于基于最小聚类划分k-means提出一个(1+ε)随机近似算法.该算法利用随机取样技术从... k-means聚类算法是解决聚类问题的一个常用方法.近年来,国外许多学者对该问题的近似常数算法和(1+ε)近似算法进行了研究.利用Kumar等人随机取样技术对于基于最小聚类划分k-means提出一个(1+ε)随机近似算法.该算法利用随机取样技术从集合中求出部分取样点,再对随机取样点进行组合找出每个聚类的部分点,将该部分点的质心点作为相应子聚类簇的质心点.通过多次运行该算法可以以较高概率求出k-means聚类的1+ε近似值. 展开更多
关键词 K-MEANS 聚类 质心点 ε质心点
下载PDF
基于泛化中心聚类的不完备数据集填补方法 被引量:11
12
作者 王妍 王凤桐 +2 位作者 王俊陆 宋宝燕 石展 《小型微型计算机系统》 CSCD 北大核心 2017年第9期2017-2021,共5页
随着信息技术、云计算、互联网以及社交网络等技术的不断发展,数据规模呈爆炸态势增长.在海量数据带来丰富信息的同时,如何对海量信息进行高效的预处理成为研究的热点.其中,对于缺失数据的处理就是数据预处理技术中一项重要的挑战.传统... 随着信息技术、云计算、互联网以及社交网络等技术的不断发展,数据规模呈爆炸态势增长.在海量数据带来丰富信息的同时,如何对海量信息进行高效的预处理成为研究的热点.其中,对于缺失数据的处理就是数据预处理技术中一项重要的挑战.传统的缺失数据的填补方法大部分都只考虑不完备集中数据完全缺失情况下的填补,然而,在海量数据集中,由于人为或者机械等原因会对数据造成一定程度的损坏,有些数据会完全缺失,而有些数据只是部分缺失,传统的填补方法未对不同程度上损坏的数据进行划分,全部按照完全缺失数据进行填补分析,忽略了部分缺失数据对数据填补结果的影响.因此,提出一种基于泛化中心聚类的填补方法(GCF),采用泛化中心聚类思想对数据进行分簇,并对随机损坏数据与聚类结果一起进行缺失数据的填补,以提高填补后数据集的正确率.实验表明,针对不同缺失度的数据集样本,提出的GCF策略在填补正确率方面都具有良好的表现. 展开更多
关键词 海量数据 不完备数据集 泛化中心聚类 数据损坏度
下载PDF
基于成对约束的判别型半监督聚类分析 被引量:51
13
作者 尹学松 胡思良 陈松灿 《软件学报》 EI CSCD 北大核心 2008年第11期2791-2802,共12页
现有一些典型的半监督聚类方法一方面难以有效地解决成对约束的违反问题,另一方面未能同时处理高维数据.通过提出一种基于成对约束的判别型半监督聚类分析方法来同时解决上述问题.该方法有效地利用了监督信息集成数据降维和聚类,即在投... 现有一些典型的半监督聚类方法一方面难以有效地解决成对约束的违反问题,另一方面未能同时处理高维数据.通过提出一种基于成对约束的判别型半监督聚类分析方法来同时解决上述问题.该方法有效地利用了监督信息集成数据降维和聚类,即在投影空间中使用基于成对约束的K均值算法对数据聚类,再利用聚类结果选择投影空间.同时,该算法降低了基于约束的半监督聚类算法的计算复杂度,并解决了聚类过程中成对约束的违反问题.在一组真实数据集上的实验结果表明,与现有相关半监督聚类算法相比,新方法不仅能够处理高维数据,还有效地提高了聚类性能. 展开更多
关键词 半监督聚类 成对约束 闭包中心 投影矩阵 聚类分析
下载PDF
一种基于双重距离尺度的高维索引结构 被引量:3
14
作者 庄毅 翁建广 +1 位作者 庄越挺 吴飞 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2007年第3期380-385,共6页
为了提高高维数据相似查询的效率,提出一种基于双重距离尺度(DDM)的新型高维索引结构.通过建模得到该DDM的四元组数据结构,对于高维空间中的数据点,通过k平均聚类算法将数据点聚成若干类,分别计算每个点对应的始点和质心距离,得到基于... 为了提高高维数据相似查询的效率,提出一种基于双重距离尺度(DDM)的新型高维索引结构.通过建模得到该DDM的四元组数据结构,对于高维空间中的数据点,通过k平均聚类算法将数据点聚成若干类,分别计算每个点对应的始点和质心距离,得到基于加权的质心距离,并将加权的质心距离作为每个数据点的索引键值,且用基于分片的B+树建立索引,得到了该索引的创建算法.高维空间的查询就转变成对一维空间的检索,并研究了数据点的维数、数据量和查询请求参数对查询性能的影响.结果表明,该DDM能更有效地缩小搜索空间,减少距离计算的开销,特别适合海量高维数据的查询. 展开更多
关键词 K近邻查询 类超球 质心距离 始点距离
下载PDF
基于加权聚类质心的SVM不平衡分类方法 被引量:4
15
作者 胡小生 钟勇 《智能系统学报》 CSCD 北大核心 2013年第3期261-265,共5页
不平衡数据分类是机器学习研究的热点问题,传统分类算法假定不同类别具有平衡分布或误分代价相同,难以得到理想的分类结果.提出一种基于加权聚类质心的SVM分类方法,在正负类样本上分别进行聚类,对每个聚类,用聚类质心和权重因子代表聚... 不平衡数据分类是机器学习研究的热点问题,传统分类算法假定不同类别具有平衡分布或误分代价相同,难以得到理想的分类结果.提出一种基于加权聚类质心的SVM分类方法,在正负类样本上分别进行聚类,对每个聚类,用聚类质心和权重因子代表聚类内样本分布和数量,相等类别数量的质心和权重因子参与SVM模型训练.实验结果表明,该方法使模型的训练样本具有较高的代表性,分类性能与其他采样方法相比得到了提升. 展开更多
关键词 机器学习 不平衡数据分类 聚类质心 支持向量机
下载PDF
基于聚类数和初始值的K-means算法改进研究 被引量:6
16
作者 屈新怀 高万里 +1 位作者 丁必荣 李朕 《组合机床与自动化加工技术》 北大核心 2011年第4期42-46,共5页
原始的K-means算法,随机生成初始质心,事先给定聚类数k,在该前提下进行聚类,大大降低了聚类的效果。文章是对原始K-means算法的改进,提出了一种基于密度选取初始质心和采取遗传算法优化聚类数k的算法。该算法在一定程度上解决了初始质... 原始的K-means算法,随机生成初始质心,事先给定聚类数k,在该前提下进行聚类,大大降低了聚类的效果。文章是对原始K-means算法的改进,提出了一种基于密度选取初始质心和采取遗传算法优化聚类数k的算法。该算法在一定程度上解决了初始质心和聚类数k对聚类精度和效率的影响,提高了聚类的准确率。最后文章通过实验证明了改进算法的有效性。 展开更多
关键词 K-MEANS算法 初始质心 聚类数k
下载PDF
基于双簇头聚类分簇和数据融合的无线传感器网络路由算法 被引量:9
17
作者 刘壮 冯欣 +3 位作者 王雁龙 李腾 张晶晶 杨文龙 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2015年第5期1013-1017,共5页
针对无线传感器网络中基于低能量自适应聚类层次(LEACH)算法进行分簇时出现的簇分布不均匀及路由能量消耗过快问题,提出一种基于双簇头聚类和数据融合的分簇算法.该算法在分好的簇中选择两个级别的簇头,两个簇头履行不同职责,能更好地... 针对无线传感器网络中基于低能量自适应聚类层次(LEACH)算法进行分簇时出现的簇分布不均匀及路由能量消耗过快问题,提出一种基于双簇头聚类和数据融合的分簇算法.该算法在分好的簇中选择两个级别的簇头,两个簇头履行不同职责,能更好地均摊能量消耗,提高了分簇均匀性.仿真实验结果表明,该算法降低了网络能耗,提升了网络生命周期. 展开更多
关键词 无线传感器网络 低能量自适应聚类层次(LEACH) 聚类 数据融合 质心
下载PDF
基于样本密度的FCM改进算法 被引量:12
18
作者 黎俊锋 朱锋峰 《科学技术与工程》 2007年第4期636-638,共3页
从聚类中心的直观属性出发,选取样本中密度较大的点作为FCM算法的初始聚类中心。解决了FCM算法对初始值敏感、收敛结果容易陷入局部极小等问题。实验结果证明这一算法的合理性和有效性。
关键词 FCM算法 聚类中心 样本密度
下载PDF
基于Hyperlink聚类的网页分类研究 被引量:1
19
作者 叶卫国 卢正鼎 王天江 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第12期5-6,31,共3页
研究并提出了基于Hyperlink聚类的分类算法 ,它不需要分析Web文档内容 ,只根据Web图来聚类 .算法性能比传统文本分类方法有很大提高 ,大大增强了网页分类的能力和效率 ,适合于海量网页分类 .实验表明基于Hyperlink聚类的分类算法 ,应用... 研究并提出了基于Hyperlink聚类的分类算法 ,它不需要分析Web文档内容 ,只根据Web图来聚类 .算法性能比传统文本分类方法有很大提高 ,大大增强了网页分类的能力和效率 ,适合于海量网页分类 .实验表明基于Hyperlink聚类的分类算法 ,应用于Web文档信息分类 ,比传统的文本分类方法更加有效 . 展开更多
关键词 网页分类 超链接 聚类 中心点
下载PDF
基于PSO的模糊K-Prototypes聚类 被引量:2
20
作者 尹波 何松华 《计算机工程与设计》 CSCD 北大核心 2008年第11期2883-2885,共3页
模糊K-Prototypes(FKP)算法能够对包含数值属性和分类属性相混合的数据集进行有效聚类,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于粒子群优化(PSO)算法和FKP算法的混合聚类算法,先利用PSO算法确定... 模糊K-Prototypes(FKP)算法能够对包含数值属性和分类属性相混合的数据集进行有效聚类,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于粒子群优化(PSO)算法和FKP算法的混合聚类算法,先利用PSO算法确定FKP的初始聚类中心,再将PSO聚类结果作为后续FKP算法的初始值。实验结果表明,新算法具有良好的收敛性和稳定性,聚类效果优于单一使用FKP算法。 展开更多
关键词 聚类分析 粒子群优化算法 模糊聚类算法 数值型属性 分类型属性 聚类中心
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部