期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
初始化类中心的增量K均值法及其在新闻事件探测中的应用 被引量:25
1
作者 雷震 吴玲达 +1 位作者 雷蕾 黄炎焱 《情报学报》 CSSCI 北大核心 2006年第3期289-295,共7页
传统的增量k均值法用于事件探测时存在着诸多不足。为了克服其缺陷,本文提出了一种用于事件探测的改进的增量k均值算法(IIKM)。该算法使用密度函数法进行聚类中心的初始化以便客观地选择初始聚类中心,既可以用于在线探测也可以用于... 传统的增量k均值法用于事件探测时存在着诸多不足。为了克服其缺陷,本文提出了一种用于事件探测的改进的增量k均值算法(IIKM)。该算法使用密度函数法进行聚类中心的初始化以便客观地选择初始聚类中心,既可以用于在线探测也可以用于回溯探测,并且执行结果受新闻语料被处理顺序的影响较小。本文对有效密度半径和特征空间维数的选择问题进行了讨论,并比较了该方法和Single—pass法及传统的K均值法的性能差异。实验结果表明本文所提出的方法是有效的。 展开更多
关键词 增量k均值 在线探测 回溯探测 初始化类中心 新闻事件探测 自然语言处理
下载PDF
聚类中心初始化的新方法 被引量:23
2
作者 李春生 王耀南 《控制理论与应用》 EI CAS CSCD 北大核心 2010年第10期1435-1440,共6页
k-均值聚类算法易受初始聚类中心的影响而陷入局部最优解.现有聚类中心初始化方法尚未得到广泛认可.本文依据每个类内至少有一个数据稠密区,且处于不同类的数据稠密区比处于同一类的数据稠密区相距更远的假设,在数据集合上构造一棵最小... k-均值聚类算法易受初始聚类中心的影响而陷入局部最优解.现有聚类中心初始化方法尚未得到广泛认可.本文依据每个类内至少有一个数据稠密区,且处于不同类的数据稠密区比处于同一类的数据稠密区相距更远的假设,在数据集合上构造一棵最小支撑树,应用根树原理在其上搜索数据稠密区并估计其密度,从中选出密度大且足够分离的数据稠密区,以其内的点作为初始聚类中心,得到了一个聚类中心初始化的新方法.将此方法与现有的方法进行比较,仿真实验表明,本文方法性能更优越. 展开更多
关键词 最小支撑树 中心初始化 k—means算法
下载PDF
基于划分采样的初始聚类中心算法
3
作者 李玮 薛惠锋 詹海亮 《太原理工大学学报》 CAS 北大核心 2011年第4期334-337,共4页
针对大数据集的初始聚类中心选取问题,在基于密度的划分算法和适用于大规模数据集限定初值的采样算法基础上,提出了一种用于初始聚类中心的划分采样算法。对聚类子空间在每一维上进行均匀划分形成不同的数据区域,根据数据区域的数据点... 针对大数据集的初始聚类中心选取问题,在基于密度的划分算法和适用于大规模数据集限定初值的采样算法基础上,提出了一种用于初始聚类中心的划分采样算法。对聚类子空间在每一维上进行均匀划分形成不同的数据区域,根据数据区域的数据点数的多少进行采样来提高采样的准确性。利用采样思想缩小了数据集的规模,保证了算法在时间上的优势。通过不同规模、不同形状的数据集对算法进行验证,实验结果表明,与其它初始聚类中心算法相比,该算法在准确率和时间上都具有一定的优势。 展开更多
关键词 中心初始化 密度估计法 限定初值算法 K—means算法
下载PDF
最小局部方差优化初始聚类中心的K-means算法 被引量:2
4
作者 王世其 张文斌 +1 位作者 蔡潮森 李建军 《软件导刊》 2020年第6期196-200,共5页
针对传统K-means算法随机选取初始聚类中心导致聚类结果随机性大、优劣不定的缺点,通过定义局部方差,利用方差反映数据密集程度的特性,提出一种基于最小局部方差优化初始聚类中心的K-means算法。该算法选取数据集中局部方差最小的点作... 针对传统K-means算法随机选取初始聚类中心导致聚类结果随机性大、优劣不定的缺点,通过定义局部方差,利用方差反映数据密集程度的特性,提出一种基于最小局部方差优化初始聚类中心的K-means算法。该算法选取数据集中局部方差最小的点作为一个初始聚类中心,并利用数据信息更新数据集,直到选到k个初始聚类中心,实现初始聚类中心优化。基于UCI数据集与人工数据集进行实验,与传统K-means算法及最小方差优化初始聚类中心的K-means算法进行性能比较。实验结果表明,基于最小局部方差优化初始聚类中心的K-means算法具有良好的聚类效果和很好的鲁棒性,且聚类时间较短,验证了算法有效性和优越性。 展开更多
关键词 K-MEANS算法 初始化中心 局部方差 密集程度
下载PDF
一种基于Hadoop云计算平台的聚类算法优化的研究 被引量:29
5
作者 张石磊 武装 《计算机科学》 CSCD 北大核心 2012年第S2期115-118,共4页
随着信息技术的飞速发展,需要处理的数据量急剧增长,聚类算法的研究面临着海量数据分析和处理的挑战。对K-means聚类算法的优化进行了深入的研究,提出了首先选定初始聚类中心的并行K-means聚类算法。对不同大小的数据集进行测试实验,证... 随着信息技术的飞速发展,需要处理的数据量急剧增长,聚类算法的研究面临着海量数据分析和处理的挑战。对K-means聚类算法的优化进行了深入的研究,提出了首先选定初始聚类中心的并行K-means聚类算法。对不同大小的数据集进行测试实验,证明该优化算法具有更好的时间性、正确性和稳定性,适合于海量数据的分析和处理。 展开更多
关键词 云计算 HADOOP平台 并行K-means MapReudce 初始化中心
下载PDF
基于知识量加权的直觉模糊均值聚类方法 被引量:1
6
作者 郭凯红 吴峥 李冬 《计算机应用研究》 CSCD 北大核心 2023年第4期1088-1094,共7页
针对聚类算法中特征数据对聚类中心贡献的差异性及算法对初始聚类中心的敏感性等问题,提出一种基于知识量加权的直觉模糊均值聚类方法。首先将原始数据集直觉模糊化并改进最新的直觉模糊知识测度计算知识量,据此实现数据集特征加权,再... 针对聚类算法中特征数据对聚类中心贡献的差异性及算法对初始聚类中心的敏感性等问题,提出一种基于知识量加权的直觉模糊均值聚类方法。首先将原始数据集直觉模糊化并改进最新的直觉模糊知识测度计算知识量,据此实现数据集特征加权,再利用核空间密度与核距离初始化聚类中心,以提高高维特征数据集的计算精度与聚类效率,最后基于类间样本距离与最小知识量原理建立聚类优化模型,得到最优迭代算法。基于UCI人工数据集的实验结果表明,所提方法较大程度地提高了聚类的准确性与迭代效率,分类正确率及执行效率分别平均提高了10.63%和31.75%,且具有良好的普适性和稳定性。该方法首次将知识测度新理论引入模糊聚类并取得优良效果,为该理论在其他相关领域的潜在应用开创了新例。 展开更多
关键词 知识测度 直觉模糊均值聚算法 数据加权 中心初始化
下载PDF
K-means聚类个性化推荐算法改进研究 被引量:4
7
作者 石颖莹 葛万成 +1 位作者 汪亮友 林佳燕 《信息通信》 2016年第1期19-21,共3页
聚类算法是数据挖掘中的重要技术,用于发现数据中未知的分类,是电子商务领域实现个性化推荐的重要方法。个性化推荐服务,是一种针对不同特征的用户推出适合于用户的信息及服务。文章介绍了一种K-means的聚类算法,该算法主要应用于数据... 聚类算法是数据挖掘中的重要技术,用于发现数据中未知的分类,是电子商务领域实现个性化推荐的重要方法。个性化推荐服务,是一种针对不同特征的用户推出适合于用户的信息及服务。文章介绍了一种K-means的聚类算法,该算法主要应用于数据挖掘领域,也在推荐系统的研究中占有重要的地位。文章还详细的分析了该算法目前存在的不足,针对该算法对初始值有一定要求这一不足,提出了一种通过预处理初始聚类中心的方法,以此来改进该算法,从实验结果可知,该改进算法能够减少迭代次数,提高计算效率。 展开更多
关键词 分析 数据分析 推荐系统 中心初始化 迭代优化
下载PDF
一种改进的快速FCM图像分割算法 被引量:4
8
作者 徐路 蒋振刚 《长春理工大学学报(自然科学版)》 2018年第2期134-138,共5页
FCM算法对图像的模糊特征具有较强的鲁棒性,在图像分割方面得到了广泛应用。但FCM算法采用随机初始化聚类中心的方法,使算法在迭代次数上有一定的不确定性。为提高FCM算法的运算效率,提出一种基于确定初始聚类中心的快速FCM图像分割算... FCM算法对图像的模糊特征具有较强的鲁棒性,在图像分割方面得到了广泛应用。但FCM算法采用随机初始化聚类中心的方法,使算法在迭代次数上有一定的不确定性。为提高FCM算法的运算效率,提出一种基于确定初始聚类中心的快速FCM图像分割算法。用最大类间方差法多次划分图像的灰度区间,根据区间中像素点的灰度值来初始化聚类中心,以使其尽可能的接近最终分割的聚类中心,减少算法的迭代次数。实验结果表明,与传统的FCM算法相比较,改进后的算法可以通过较少的迭代次数及运算时间分割图像。且该算法可以应用于诸多采取随机初始化聚类中心的FCM相关的算法中,以提高算法的运算效率。 展开更多
关键词 模糊C均值聚 图像分割 初始化中心
下载PDF
一种基于几何中心的模糊c均值聚类方法
9
作者 张元武 王丽珍 孔云 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第S1期189-193,共5页
对模糊c均值聚类算法容易陷入局部极值点和鞍点而得不到全局最优模糊划分进行研究,提出了一种新颖的基于几何中心的模糊c均值聚类(GCFCM)方法,利用网格和密度找到数据集的近似聚类中心.实验结果表明:该算法与经典FCM聚类算法相比收敛速... 对模糊c均值聚类算法容易陷入局部极值点和鞍点而得不到全局最优模糊划分进行研究,提出了一种新颖的基于几何中心的模糊c均值聚类(GCFCM)方法,利用网格和密度找到数据集的近似聚类中心.实验结果表明:该算法与经典FCM聚类算法相比收敛速度更快,迭代步数更少,解决了容易陷入局部极值点和鞍点的问题. 展开更多
关键词 模糊c均值聚(FCM)算法 网格 密度 初始化中心 二分法 几何中心
原文传递
双绞线图像快速分割算法
10
作者 林宜丙 石守东 孙书丹 《数据通信》 2015年第3期49-54,共6页
提高双绞线图像分割速度是实时测量双绞线绕距的关键。针对模糊C-均值算法聚类速度慢、依赖特征空间分布结构、随机初始化聚类中心等问题,本文提出了一种用于双绞线图像的快速分割算法。首先,快速算法将多维RGB空间转换为一维灰度空间,... 提高双绞线图像分割速度是实时测量双绞线绕距的关键。针对模糊C-均值算法聚类速度慢、依赖特征空间分布结构、随机初始化聚类中心等问题,本文提出了一种用于双绞线图像的快速分割算法。首先,快速算法将多维RGB空间转换为一维灰度空间,利用优化搜索范围的二维最大类间方差法分割双绞线图像的前景和背景图像;其次由于一维灰度空间无法有效描述前景图像中像素点在特征空间的分布情况,故将其特征空间转换为CMYK空间,并利用改进的模糊C-均值算法分割双绞线前景图像。该改进算法采用了特征距离,使得算法对数据点的分布具有更好的健壮性,并提出了一种迭代合并最近邻域点的方法初始化聚类中心,使算法迭代次数大大降低。最后与金标准库图像对比,发现改进后的评价参数得到了有效地提升,分割时间约为模糊C-均值算法的31%。通过本文所提出的算法可以快速准确地分割双绞线图像。 展开更多
关键词 双绞线图像 二维间方差 模糊C-均值聚 评价标准 中心初始化 特征距离
下载PDF
一种基于高斯核化有效性指标的自适应优选聚类数的FKCM 被引量:3
11
作者 唐苦 王昕 +1 位作者 王振雷 钱锋 《计算机与应用化学》 CAS CSCD 北大核心 2012年第10期1199-1203,共5页
针对传统的模糊核聚类算法(FKCM)需给出聚类个数,且对初始值敏感、易陷入局部最优的缺点,本文提出了一种基于高斯核化有效性指标的自适应优选聚类数的模糊核聚类算法(GKVI-AOCN-FKCM)。利用基于密度和距离的方法选取初始聚类中心,克服... 针对传统的模糊核聚类算法(FKCM)需给出聚类个数,且对初始值敏感、易陷入局部最优的缺点,本文提出了一种基于高斯核化有效性指标的自适应优选聚类数的模糊核聚类算法(GKVI-AOCN-FKCM)。利用基于密度和距离的方法选取初始聚类中心,克服了对初始值的敏感,提高了聚类效率。然后用高斯核函数核化后的有效性指标评价聚类效果并自动确定最佳分类数,从而无监督地实现对数据集的模糊划分。对Iris数据集的仿真实验及石脑油属性数据分类的应用验证了算法的可行性和有效性。 展开更多
关键词 分析 模糊聚 高斯核函数 中心初始化 有效性指标
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部