期刊文献+
共找到255篇文章
< 1 2 13 >
每页显示 20 50 100
基于优化初始类中心点的K-means改进算法 被引量:10
1
作者 秦钰 荆继武 +1 位作者 向继 张爱华 《中国科学院研究生院学报》 CAS CSCD 2007年第6期771-777,共7页
K-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用.由于K-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果.提出了一种K-means算法的改进算法,首先探测数据集中的相对密集区域... K-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用.由于K-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果.提出了一种K-means算法的改进算法,首先探测数据集中的相对密集区域,再利用这些密集区域生成初始类中心点.该方法能够很好地排除类边缘点和噪声点的影响,并且能够适应数据集中各个实际类别密度分布不平衡的情况,最终获得较好的聚类效果. 展开更多
关键词 K-MEANS 初始类中心
下载PDF
K-modes聚类初始类中心选择算法研究 被引量:2
2
作者 张佃伦 江峰 《计算机光盘软件与应用》 2015年第3期94-95,共2页
针对现有的K-modes聚类初始类中心选择方法所存在的问题,本文提出一种基于加权密度的初始类中心选择算法。在该算法中,我们通过计算对象的加权密度来选择初始类中心,而在计算对象的加权密度时,不同的属性将根据其重要性被赋予不同的权重... 针对现有的K-modes聚类初始类中心选择方法所存在的问题,本文提出一种基于加权密度的初始类中心选择算法。在该算法中,我们通过计算对象的加权密度来选择初始类中心,而在计算对象的加权密度时,不同的属性将根据其重要性被赋予不同的权重,从而可以有效地体现出不同属性之间的差异。 展开更多
关键词 粗糙集 加权密度 初始类中心
下载PDF
一种修正评分偏差并精细聚类中心的协同过滤推荐算法 被引量:1
3
作者 马鑫 段刚龙 《统计与决策》 北大核心 2024年第4期23-27,共5页
协同过滤作为国内外学者普遍关注的推荐算法之一,受评分失真、数据稀疏等问题影响,算法推荐效果不尽如人意。为解决上述问题,文章提出了一种改进的聚类协同过滤推荐算法。首先,该算法利用无监督情感挖掘技术将评论情感映射为一个固定区... 协同过滤作为国内外学者普遍关注的推荐算法之一,受评分失真、数据稀疏等问题影响,算法推荐效果不尽如人意。为解决上述问题,文章提出了一种改进的聚类协同过滤推荐算法。首先,该算法利用无监督情感挖掘技术将评论情感映射为一个固定区间中的值,通过加权修正用户评分偏差;然后,构建修正后用户-产品评分矩阵的数据场,利用启发式寻优算法计算最佳聚类数和最优初始聚类中心,进而对用户进行划分聚类,结合最近邻用户相似性与评分产生推荐结果;最后,基于三个自建真实数据集对所提算法性能和有效性进行全面评估。实验结果表明,改进算法在精度Precision、召回率Recall和F1-Score评价指标上的表现均优于其他算法,能够有效应对数据稀疏的问题,提升推荐系统的推荐效果。 展开更多
关键词 评分偏差 随机初始中心 协同过滤 评论情感挖掘 数据场聚
下载PDF
基于结构系数的K-means初始聚类中心选择算法
4
作者 李汉波 魏福义 +3 位作者 张嘉龙 刘志伟 黄杰 方月宜 《计算机与数字工程》 2023年第5期993-996,1107,共5页
传统的K-means算法选取初始聚类中心时的不确定性会导致聚类结果不稳定。论文提出了基于相异度的邻域及其结构系数的概念,从最小的结构系数开始,按照其递增顺序寻找初始聚类中心;随后采用依次缩小邻域的技巧逐步探索,直到找到K个初始聚... 传统的K-means算法选取初始聚类中心时的不确定性会导致聚类结果不稳定。论文提出了基于相异度的邻域及其结构系数的概念,从最小的结构系数开始,按照其递增顺序寻找初始聚类中心;随后采用依次缩小邻域的技巧逐步探索,直到找到K个初始聚类中心。该方法同时得到li(i=0,1,2,…,q)个初始聚类中心及其对应的数据分类结果。实验证明,对比于以往的算法,新算法具有更高的分类准确率以及更少的迭代次数。 展开更多
关键词 K-MEANS聚 相异度 初始中心 结构系数
下载PDF
初始化类中心的增量K均值法及其在新闻事件探测中的应用 被引量:25
5
作者 雷震 吴玲达 +1 位作者 雷蕾 黄炎焱 《情报学报》 CSSCI 北大核心 2006年第3期289-295,共7页
传统的增量k均值法用于事件探测时存在着诸多不足。为了克服其缺陷,本文提出了一种用于事件探测的改进的增量k均值算法(IIKM)。该算法使用密度函数法进行聚类中心的初始化以便客观地选择初始聚类中心,既可以用于在线探测也可以用于... 传统的增量k均值法用于事件探测时存在着诸多不足。为了克服其缺陷,本文提出了一种用于事件探测的改进的增量k均值算法(IIKM)。该算法使用密度函数法进行聚类中心的初始化以便客观地选择初始聚类中心,既可以用于在线探测也可以用于回溯探测,并且执行结果受新闻语料被处理顺序的影响较小。本文对有效密度半径和特征空间维数的选择问题进行了讨论,并比较了该方法和Single—pass法及传统的K均值法的性能差异。实验结果表明本文所提出的方法是有效的。 展开更多
关键词 增量k均值 在线探测 回溯探测 初始中心 新闻事件探测 自然语言处理
下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:62
6
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 K—Means算法 初始中心 直方图 最优划分方法
下载PDF
基于特征关联度的K-means初始聚类中心优化算法 被引量:29
7
作者 陈兴蜀 吴小松 +1 位作者 王文贤 王海舟 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2015年第1期13-19,共7页
针对K-means算法在进行文本聚类时对初始聚类中心敏感的问题,提出基于特征关联度的初始聚类中心选择算法。由于在原始文本集中不易找到类别代表性都较强的多个独立文本作为初始聚类中心,因此先从降维后的文本特征集合中,选取关联度大的... 针对K-means算法在进行文本聚类时对初始聚类中心敏感的问题,提出基于特征关联度的初始聚类中心选择算法。由于在原始文本集中不易找到类别代表性都较强的多个独立文本作为初始聚类中心,因此先从降维后的文本特征集合中,选取关联度大的特征构造新的文本集,再利用"或运算"合并其中的相似文本得到初始聚类中心候选集,最后通过计算文本密度并结合"最小最大"原则从候选集中选取最优的初始中心。在5个数据集上进行对比实验,该算法在多数聚类结果中的F-score值都高于90%,熵值低于0.5,明显优于Mahout提供的K-means算法,表明该算法可选出高质量的初始聚类中心,得到更好的聚类结果。 展开更多
关键词 K-MEANS 特征关联度 初始中心 文本聚
下载PDF
K-means算法初始聚类中心选择的优化 被引量:49
8
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 K—means算法 初始中心 TDKM算法
下载PDF
优化初始聚类中心的改进K-means算法 被引量:33
9
作者 唐东凯 王红梅 +1 位作者 胡明 刘钢 《小型微型计算机系统》 CSCD 北大核心 2018年第8期1819-1823,共5页
针对K-means算法对初始聚类中心和离群点敏感的缺点,提出了一种优化初始聚类中心的改进K-means算法.该算法首先计算出数据集中每个数据对象的离群因子,并根据离群因子的值对数据集进行升序排列,使得中心点的位置靠前.然后在升序排列的... 针对K-means算法对初始聚类中心和离群点敏感的缺点,提出了一种优化初始聚类中心的改进K-means算法.该算法首先计算出数据集中每个数据对象的离群因子,并根据离群因子的值对数据集进行升序排列,使得中心点的位置靠前.然后在升序排列的数据集上,引入取样因子α,得到候选初始中心点集.最后,根据最大最小距离的思想,在候选初始中心点集上选取k个数据对象作为初始聚类中心.实验结果表明,在时间基本相同的情况下,提出的改进算法相对K-means、K-means++算法具有较好的稳定性和较高的聚类准确率,并且聚类的平均迭代次数也相对较小. 展开更多
关键词 K-MEANS算法 初始中心 离群因子 取样因子 最大最小距离
下载PDF
一种有效的K-means聚类中心初始化方法 被引量:86
10
作者 熊忠阳 陈若田 张玉芳 《计算机应用研究》 CSCD 北大核心 2011年第11期4188-4190,共3页
传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上... 传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上,选取到所有已初始化聚类中心距离乘积最大的高密度点作为当前聚类中心。理论分析与对比实验结果表明,此方法相对于传统K-means算法和最大最小距离法有更快的收敛速度、更高的准确率和更强的稳定性。 展开更多
关键词 K-均值算法 基于密度 初始中心 最大最小距离 最大距离积
下载PDF
对k-means初始聚类中心的优化 被引量:29
11
作者 仝雪姣 孟凡荣 王志晓 《计算机工程与设计》 CSCD 北大核心 2011年第8期2721-2723,2788,共4页
针对传统k-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布选取初始聚类中心的改进k-means算法。该算法利用贪心思想构建K个数据集合,集合的大小与数据的实际分布密切相关,集合中的数据彼此间相互靠近。取集合中数据的平均... 针对传统k-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布选取初始聚类中心的改进k-means算法。该算法利用贪心思想构建K个数据集合,集合的大小与数据的实际分布密切相关,集合中的数据彼此间相互靠近。取集合中数据的平均值作为初始聚类中心,由此得到的初始聚类中心非常接近迭代聚类算法期待的聚类中心。理论分析和实验结果表明,改进算法能改善其聚类性能,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 K-MEANS算法 数据分布 初始中心 改进算法
下载PDF
最小方差优化初始聚类中心的K-means算法 被引量:85
12
作者 谢娟英 王艳娥 《计算机工程》 CAS CSCD 2014年第8期205-211,223,共8页
传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该... 传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该算法运用样本空间分布信息,通过计算样本空间分布的方差得到样本紧密度信息,选择方差最小(即紧密度最高)且相距一定距离的样本作为初始聚类中心,实现优化的K-means聚类。在UCI机器学习数据库数据集和含有噪音的人工模拟数据集上的实验结果表明,该算法不仅能得到较好的聚类结果,且聚类结果稳定,对噪音具有较强的免疫性能。 展开更多
关键词 K-MEANS算法 方差 紧密度 初始中心
下载PDF
粒计算优化初始聚类中心的K-medoids聚类算法 被引量:13
13
作者 谢娟英 鲁肖肖 +1 位作者 屈亚楠 高红超 《计算机科学与探索》 CSCD 北大核心 2015年第5期611-620,共10页
针对快速K-medoids聚类算法所选初始聚类中心可能位于同一类簇的缺陷,以及基于粒计算的K-medoids算法构造样本去模糊相似矩阵时需要主观给定阈值的缺陷,提出了粒计算优化初始聚类中心的K-medoids聚类算法。该算法结合粒计算与最大最小... 针对快速K-medoids聚类算法所选初始聚类中心可能位于同一类簇的缺陷,以及基于粒计算的K-medoids算法构造样本去模糊相似矩阵时需要主观给定阈值的缺陷,提出了粒计算优化初始聚类中心的K-medoids聚类算法。该算法结合粒计算与最大最小距离法,优化K-medoids算法初始聚类中心的选取,选择处于样本分布密集区域且相距较远的K个样本作为初始聚类中心;使用所有样本的相似度均值作为其构造去模糊相似矩阵的阈值。人工模拟数据集和UCI机器学习数据库数据集的实验测试表明,新K-medoids聚类算法具有更稳定的聚类效果,其准确率和Adjusted Rand Index等聚类结果评价指标值优于传统K-medoids聚类算法、快速K-medoids聚类算法和基于粒计算的K-medoids聚类算法。 展开更多
关键词 粒计算 初始中心 最大最小距离法 K-me doids聚算法
下载PDF
初始中心优化的K-Means聚类算法 被引量:47
14
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 K—Means聚算法 初始中心 优化
下载PDF
基于初始聚类中心选取的改进FCM聚类算法 被引量:67
15
作者 张慧哲 王坚 《计算机科学》 CSCD 北大核心 2009年第6期206-209,共4页
针对模糊C-均值(Fuzzy C-Means,FCM)算法聚类效果往往受到初始聚类中心影响,收敛结果易陷入局部极小的问题,提出了一种改进的模糊C均值聚类算法。算法给出了一种简洁快速的初始聚类中心的选取规则,并根据聚类中心的分离特性改进了目标函... 针对模糊C-均值(Fuzzy C-Means,FCM)算法聚类效果往往受到初始聚类中心影响,收敛结果易陷入局部极小的问题,提出了一种改进的模糊C均值聚类算法。算法给出了一种简洁快速的初始聚类中心的选取规则,并根据聚类中心的分离特性改进了目标函数,从而使获得的聚类结果为全局最优。仿真结果证明新算法与传统FCM方法相比,迭代次数少,准确率高,同时也更加适用于样本数据分类不均衡的聚类问题。 展开更多
关键词 FCM聚 目标函数 初始中心 分离度
下载PDF
优化初始聚类中心的改进k-means算法 被引量:56
16
作者 张靖 段富 《计算机工程与设计》 CSCD 北大核心 2013年第5期1691-1694,1699,共5页
传统k-means算法随机选取初始聚类中心使聚类结果不稳定,诸多优化算法的时间复杂度较高,为了提高聚类稳定性并降低时间复杂度,提出了基于个体轮廓系数自适应地选取优秀样本以确定初始聚类中心的改进k-means算法。该算法多次调用传统k-me... 传统k-means算法随机选取初始聚类中心使聚类结果不稳定,诸多优化算法的时间复杂度较高,为了提高聚类稳定性并降低时间复杂度,提出了基于个体轮廓系数自适应地选取优秀样本以确定初始聚类中心的改进k-means算法。该算法多次调用传统k-means算法聚类,根据k个类中心的个体轮廓系数以及各样本与类中心的距离,自适应地选取优秀样本,求其均值作为初始聚类中心。在多个UCI数据集上的实验表明,该算法聚类时间短,具有较高的轮廓系数和准确率。 展开更多
关键词 K均值算法 初始中心 个体轮廓系数 自适应
下载PDF
密度峰值优化初始中心的K-medoids聚类算法 被引量:27
17
作者 谢娟英 屈亚楠 《计算机科学与探索》 CSCD 北大核心 2016年第2期230-247,共18页
针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算... 针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算法。算法采用样本x i的t最近邻距离之和倒数度量其局部密度ρi,并定义样本x i的新距离δi,构造样本距离相对于样本密度的决策图。局部密度较高且相距较远的样本位于决策图的右上角区域,且远离数据集的大部分样本。选择这些样本作为初始聚类中心,使得初始聚类中心位于不同类簇,并自动得到数据集类簇数。为进一步优化聚类结果,提出采用类内距离与类间距离之比作为聚类准则函数。在UCI数据集和人工模拟数据集上进行了实验测试,并对初始聚类中心、迭代次数、聚类时间、Rand指数、Jaccard系数、Adjusted Rand index和聚类准确率等经典聚类有效性评价指标进行了比较,结果表明提出的K-medoids算法能有效识别数据集的真实类簇数和合理初始类簇中心,减少聚类迭代次数,缩短聚类时间,提高聚类准确率,并对噪音数据具有很好的鲁棒性。 展开更多
关键词 K-medoids算法 初始中心 密度峰值 准则函数
下载PDF
基于邻域模型的K-means初始聚类中心选择算法 被引量:6
18
作者 曹付元 梁吉业 姜广 《计算机科学》 CSCD 北大核心 2008年第11期181-184,共4页
传统的K-means算法由于其方法简单,在模式识别和机器学习中被广泛讨论和应用。但由于K-means算法随机选择初始聚类中心,而初始聚类中心的选择对最终的聚类结果有着直接的影响,因此算法不能保证得到一个唯一的聚类结果。利用邻域模型中... 传统的K-means算法由于其方法简单,在模式识别和机器学习中被广泛讨论和应用。但由于K-means算法随机选择初始聚类中心,而初始聚类中心的选择对最终的聚类结果有着直接的影响,因此算法不能保证得到一个唯一的聚类结果。利用邻域模型中对象邻域的上下近似,定义了对象邻域耦合度和分离度的概念,给出了对象在初始聚类中心选择中的重要性,提出了一种初始聚类中心的选择算法。另外,分析了邻域模型中三种范数对聚类精度的影响,并和随机选择初始聚类中心、CCIA选择初始聚类中心算法进行了比较,实验结果表明,该算法是有效的。 展开更多
关键词 邻域模型 初始中心 K-MEANS聚 粗糙集
下载PDF
方差优化初始中心的K-medoids聚类算法 被引量:13
19
作者 谢娟英 高瑞 《计算机科学与探索》 CSCD 北大核心 2015年第8期973-984,共12页
针对快速K-medoids聚类算法存在密度计算复杂耗时和初始聚类中心可能位于同一类簇的缺陷,以及基于邻域的K-medoids算法的邻域半径需要人为给定一个调节系数的主观性缺陷,分别以样本间距离均值和相应样本的标准差为邻域半径,以方差作为... 针对快速K-medoids聚类算法存在密度计算复杂耗时和初始聚类中心可能位于同一类簇的缺陷,以及基于邻域的K-medoids算法的邻域半径需要人为给定一个调节系数的主观性缺陷,分别以样本间距离均值和相应样本的标准差为邻域半径,以方差作为样本分布密集程度的度量,选取方差值最小且其间距离不低于邻域半径的样本为K-medoids的初始聚类中心,提出了两种方差优化初始中心的K-medoids算法。在UCI数据集和人工模拟数据集上进行了实验测试,并对各种聚类指标进行了比较,结果表明该算法需要的聚类时间短,得到的聚类结果优,适用于较大规模数据集的聚类。 展开更多
关键词 方差 标准差 邻域 初始中心 K-medoids聚
下载PDF
一种选取初始聚类中心的方法 被引量:19
20
作者 刘立平 孟志青 《计算机工程与应用》 CSCD 北大核心 2004年第8期179-180,共2页
对k平均值聚类法中初始聚类中心的选取问题进行了深入研究,给出了一个较好的聚类中心选取算法。该算法也可以用于需要确定初始中心的其它聚类算法。实验结果表明该算法的效果较好。
关键词 k平均值方法 初始中心
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部