期刊文献+
共找到454篇文章
< 1 2 23 >
每页显示 20 50 100
基于蚁群算法的三支k-means聚类算法
1
作者 朱金 徐天杰 王平心 《江苏科技大学学报(自然科学版)》 CAS 2024年第3期63-69,共7页
在聚类分析中,三支k-means聚类算法较具有较强的处理边界不确定数据的能力,但仍然存在对初始聚类中心敏感的问题.通过将蚁群算法和三支k-means聚类算法相结合,给出了一种基于蚁群算法的三支k-means聚类算法来解决这一问题.利用蚁群算法... 在聚类分析中,三支k-means聚类算法较具有较强的处理边界不确定数据的能力,但仍然存在对初始聚类中心敏感的问题.通过将蚁群算法和三支k-means聚类算法相结合,给出了一种基于蚁群算法的三支k-means聚类算法来解决这一问题.利用蚁群算法中随机概率选择策略和信息素的正负反馈机制,动态调整权重的方法,对三支k-means聚类算法进行优化.在UCI数据集上实验证明,该方法对聚类结果的性能指标有所提高. 展开更多
关键词 三支k-means k-MEANS聚类算法 聚类中心 蚁群算法
下载PDF
基于改进K-means算法的物流配送中心选址研究 被引量:1
2
作者 姚佼 吴秀荣 +3 位作者 李皓 谢贝贝 王诗璇 梁益铭 《物流科技》 2024年第5期10-13,19,共5页
针对传统K-means算法需要主观设定K值及无法处理类别型数据问题,文章运用肘部法及轮廓系数法确定合理K值,对类别型数据采取独热编码(One-Hot Encoding)转换为可以处理的连续型数据,并将其运用到在物流配送中心选址中;并综合考虑多种类... 针对传统K-means算法需要主观设定K值及无法处理类别型数据问题,文章运用肘部法及轮廓系数法确定合理K值,对类别型数据采取独热编码(One-Hot Encoding)转换为可以处理的连续型数据,并将其运用到在物流配送中心选址中;并综合考虑多种类别的影响因素,构建了相应的影响因素指标体系,提出的模型能够识别输入数据的数值型及类别型数据,实现样本的有效聚类。相关的案例分析结果表明,相比传统K-means聚类,文章的改进K-means算法选址结果可使物流总成本降低8.76%,运营成本降低14.85%,固定成本降低8.09%,效果显著。 展开更多
关键词 物流配送中心选址 k-MEANS聚类算法 肘部法 轮廓系数法 独热编码
下载PDF
基于交通拥堵信息的高速公路拥堵路段ACK-Means聚类
3
作者 陈昕 阮永娇 肇毓 《科学技术与工程》 北大核心 2024年第21期9194-9200,共7页
为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇... 为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇类密度、簇类间距以及簇类强度,同时又考虑到数据样本的偶然性,对离群点进行合理分配,ACK-Means算法可实现自适应确定聚类中心C和类别K值。基于实际交通拥堵信息构建数据集,Python编程实现高速公路拥堵路段ACK-Means聚类,巧妙解决了高速公路拥堵路段聚类数目K和聚类中心C设定问题。聚类结果表明,ACK-Means算法实现高速公路拥堵路段无监督聚类,聚类结果完全基于实际的高速公路交通拥堵信息,具有更高的实用性。 展开更多
关键词 交通拥堵聚类 ACk-Means算法 自适应聚类中心 自适应K值 交通拥堵信息
下载PDF
基于主题词向量中心点的K-means文本聚类算法
4
作者 季铎 刘云钊 +1 位作者 彭如香 孔华锋 《计算机应用与软件》 北大核心 2024年第10期282-286,318,共6页
K-means由于其时间复杂度低运行速度快一直是最为流行的聚类算法之一,但是该算法在进行聚类时需要预先给出聚类个数和初始类中心点,其选取得合适与否会直接影响最终聚类效果。该文对初始类中心和迭代类中心的选取进行大量研究,根据决策... K-means由于其时间复杂度低运行速度快一直是最为流行的聚类算法之一,但是该算法在进行聚类时需要预先给出聚类个数和初始类中心点,其选取得合适与否会直接影响最终聚类效果。该文对初始类中心和迭代类中心的选取进行大量研究,根据决策图进行初始类中心的选择,利用每个类簇的主题词向量替代均值作为迭代类中心。实验表明,该文的初始点选取方法能够准确地选取初始点,且利用主题词向量作为迭代类中心能够很好地避免噪声点和噪声特征的影响,很大程度上地提高了K-means算法的性能。 展开更多
关键词 k-MEANS 初始点 决策图 迭代类中心 主题词向量
下载PDF
基于改进K-means算法的大跨屋盖结构表面风荷载分区研究
5
作者 李玉学 杨君保 +1 位作者 陈铁 田玉基 《防灾减灾工程学报》 CSCD 北大核心 2024年第5期1106-1114,共9页
针对K-means算法进行大跨屋盖结构表面风荷载分区中存在的分类数k值需凭经验事先给定以及所有初始聚类中心均需随机选取带来的分类情况数过多、从中寻找最优分类结果工作量大且效率低的问题,提出基于改进K-means算法的大跨屋盖结构表面... 针对K-means算法进行大跨屋盖结构表面风荷载分区中存在的分类数k值需凭经验事先给定以及所有初始聚类中心均需随机选取带来的分类情况数过多、从中寻找最优分类结果工作量大且效率低的问题,提出基于改进K-means算法的大跨屋盖结构表面风荷载分区方法。首先,建立分类数k与其相应测点风荷载的误差平方和(Sum of the Squared Errors:SSE)关系曲线,引入手肘法基本思想,实现最优分类数kst值的精准识别;其次,在首个初始聚类中心随机选取基础上,引入轮盘法基本思想,完成对剩余初始聚类中心的高效选取;然后,根据类内紧凑、类间分散的原则,通过类内紧凑性判定指标S(k)和类间分散性判定指标D(k),构造并借助SD(k)值有效性检验,得到最优的风荷载分区结果;最后,以北京奥林匹克网球中心大跨悬挑屋盖结构为例,针对风洞试验所得风荷载测试结果,采用所提方法对其表面最不利风压系数进行分区计算,并与传统K-means算法进行对比,结果表明,所提方法能够高效实现大跨屋盖结构表面风压分区计算,具有较好的工程应用价值。 展开更多
关键词 大跨屋盖结构 风荷载分区 k-MEANS算法 分类数 聚类中心
下载PDF
基于改进K-means聚类定心算法的曲轴轴颈圆度误差评定
6
作者 邹春龙 黄配乐 +2 位作者 王生怀 冯乾新 王宸 《工具技术》 北大核心 2024年第6期141-150,共10页
曲轴轴颈的圆度误差作为曲轴必检的核心尺寸,直接影响曲轴的寿命和性能。针对圆度误差求解数据量多和计算复杂的问题,提出一种基于改进K-means聚类定心算法的圆度误差评定方法。该算法通过对轴颈采样通道的样本点进行环形聚类获得集合UK... 曲轴轴颈的圆度误差作为曲轴必检的核心尺寸,直接影响曲轴的寿命和性能。针对圆度误差求解数据量多和计算复杂的问题,提出一种基于改进K-means聚类定心算法的圆度误差评定方法。该算法通过对轴颈采样通道的样本点进行环形聚类获得集合UK,同时以设计的目标控制器剔除UK的噪声点,以UK的最小二乘法圆度评定误差fm来估计整个环形样本的误差。聚类值从K=5循环迭代增加,直至fm符合预设统计质量控制规划。评定结果表明,聚类定心算法的圆度误差评定方法能实现曲轴圆度误差的高效、精确评定。 展开更多
关键词 曲轴 圆度评定 k-MEANS 聚类定心
下载PDF
基于改进K-Means算法的电动汽车充电负荷特性分析 被引量:1
7
作者 李俊达 陈姝敏 +2 位作者 王天安 张玎一 吴全才 《云南电力技术》 2024年第3期10-13,19,共5页
电动汽车充电行为具有较大的随机性,一定程度上影响电网的稳定运行和规划。为更准确地分析电动汽车充电负荷的特性,提出一种基于改进K-Means算法的聚类分析方法。针对K-Means算法在初始聚类中心选取上的随机性和不稳定性,首先利用Mini B... 电动汽车充电行为具有较大的随机性,一定程度上影响电网的稳定运行和规划。为更准确地分析电动汽车充电负荷的特性,提出一种基于改进K-Means算法的聚类分析方法。针对K-Means算法在初始聚类中心选取上的随机性和不稳定性,首先利用Mini Batch K-Means算法的随机抽样能力优化初始聚类中心的选择,随后结合K-Means算法进行迭代优化,有效解决K-Means算法聚类结果不稳定的问题。以云南某城市充电桩负荷数据进行算例分析,结果表明,所提算法相比传统方法相比能更加准确地对多个不同负荷特性的用户进行分类,从而更有效地指导有序用电管理策略的制定。 展开更多
关键词 k-MEANS算法 Mini Batch k-Means算法 负荷特性分析
下载PDF
基于K-center和信息增益的Web搜索结果聚类方法 被引量:1
8
作者 丁振国 孟星 《计算机应用研究》 CSCD 北大核心 2008年第10期3125-3127,共3页
基于K-center和信息增益的概念,将改进后的FPF(furthest-point-first)算法用于Web搜索结果聚类,提出了聚类标志方法,使得聚类呈现出的结果更易于用户理解,给出了评价聚类质量的模型。将该算法与Lingo,K-means算法进行比较,其结果表明,... 基于K-center和信息增益的概念,将改进后的FPF(furthest-point-first)算法用于Web搜索结果聚类,提出了聚类标志方法,使得聚类呈现出的结果更易于用户理解,给出了评价聚类质量的模型。将该算法与Lingo,K-means算法进行比较,其结果表明,本算法能够较好地平衡聚类质量和速度,更加适用于Web检索聚类。 展开更多
关键词 WEB文档 聚类 聚类标志 k-center 信息增益
下载PDF
K-centers聚类算法在教学评估中的应用 被引量:4
9
作者 高峰 《计算机工程与应用》 CSCD 北大核心 2007年第12期191-193,共3页
考虑不同出现频率的可分类属性值对聚类中心的影响,通过重新定义聚类中心和距离,提出了一种新的聚类算法K-centers,这种算法能够有效处理可分类和混合类型数据。在此基础上,将K-centers应用于课程教学评估,分析不同类型课程的特点,为评... 考虑不同出现频率的可分类属性值对聚类中心的影响,通过重新定义聚类中心和距离,提出了一种新的聚类算法K-centers,这种算法能够有效处理可分类和混合类型数据。在此基础上,将K-centers应用于课程教学评估,分析不同类型课程的特点,为评估教学提供了参考。 展开更多
关键词 聚类分析 k-centers 混合类型 教学评估
下载PDF
优先级k-中心问题的FPT近似算法
10
作者 冯启龙 龙睿 +1 位作者 吴小良 仲文明 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第7期2718-2724,共7页
优先级k-中心问题是聚类领域中1个经典的NP-难问题。给定度量空间中的1个集合X和参数k∈N+,其中,集合X中每个点v都被赋予1个优先级参数r(v)∈R+,求解1个大小为k的子集S■X,考虑集合X中任意数据点到集合S的距离与r(v)之间比值,找到最大比... 优先级k-中心问题是聚类领域中1个经典的NP-难问题。给定度量空间中的1个集合X和参数k∈N+,其中,集合X中每个点v都被赋予1个优先级参数r(v)∈R+,求解1个大小为k的子集S■X,考虑集合X中任意数据点到集合S的距离与r(v)之间比值,找到最大比值,目标是最小化该比值。对于优先级k-中心问题,目前最好的结近似算法是多项式时间内的2-近似算法,该问题不存在1个(2-ε)-近似算法,(其中,ε为用于控制算法近似比的参数)。本文研究优先级k-中心问题的固定参数可解(fixed-parameter tractability,FPT)时间内的近似算法。基于k-中心问题的贪心策略,提出新的中心点选取方法。研究结果表明:该方法通过贪心策略选取一定规模的候选中心点集,利用加倍度量维度的性质去限制该集合的大小,实现了FPT时间内的(1+ε)-近似算法,降低了目前该问题的近似比。 展开更多
关键词 近似算法 FPT近似算法 优先级k-中心问题 k-中心问题
下载PDF
一种面向SNP选择的K-Center算法
11
作者 曹莉敏 周从华 《计算机应用与软件》 北大核心 2020年第9期227-234,共8页
单核苷酸多态性(Single Nucleotide Polymorphism,SNP)数据是一种关于遗传病理学研究的重要数据,其高维少样本,存在大量噪声和冗余,并且SNP位点之间存在连锁不平衡性,因此需要对SNP数据进行降维。提出一种改进的K-Center算法——K-MSU... 单核苷酸多态性(Single Nucleotide Polymorphism,SNP)数据是一种关于遗传病理学研究的重要数据,其高维少样本,存在大量噪声和冗余,并且SNP位点之间存在连锁不平衡性,因此需要对SNP数据进行降维。提出一种改进的K-Center算法——K-MSU算法。使用K-Center进行数据降维,在K-Center算法的距离度量中引入对称不确定性,解决SNP数据之间的连锁不平衡性;针对K-Center算法的随机选择初始聚类中心的方法容易对聚类结果产生较大的影响,使用基于信息增益的密度方法去选择初始聚类中心。在医院提供的临床实验数据的实验结果表明,K-MSU算法在SNP选择中具有更高的分类准确率和较好的效果。 展开更多
关键词 单核苷酸多态 SNP选择 k-center 特征选择 对称不确定性 信息增益
下载PDF
基于粒子群优化K-means聚类算法的快递网点选址方法研究 被引量:2
12
作者 倪萌萌 李春树 刘银 《宁夏工程技术》 CAS 2023年第2期181-186,192,共7页
对于大规模客户群体,如何高效合理地规划出网点位置,在节省物流企业配送成本的前提下提高货物的周转率和及时送达率,目前已成为快递物流系统网络优化的难点。为解决此类问题,针对某地区物流公司的客户信息,采用粒子群优化的K-means聚类... 对于大规模客户群体,如何高效合理地规划出网点位置,在节省物流企业配送成本的前提下提高货物的周转率和及时送达率,目前已成为快递物流系统网络优化的难点。为解决此类问题,针对某地区物流公司的客户信息,采用粒子群优化的K-means聚类算法进行快递网点选址。具体过程:首先采用手肘法评估研究区域需设立的最佳快递网点数;为改善K-means初始簇中心带来的易陷入局部最优解问题,利用粒子群优化算法对数据集进行迭代寻优,重新确定初始簇中心;最后通过K-means聚类算法在全局最优解附近空间完成聚类任务,最终得到的聚类结果代表配送区域的划分方案,聚类的簇中心即为快递网点位置。此外,利用3个评价指标对粒子群优化Kmeans聚类算法和传统K-means聚类算法进行对比分析。结果表明,结合粒子群优化算法后的聚类结果其类内数据相似度更高,类间数据的差异与距离更大,取得的聚类效果更合理。 展开更多
关键词 粒子群优化 k-MEANS聚类 快递网点 簇中心
下载PDF
基于改进的K-means风电机异常数据检测 被引量:5
13
作者 陶永辉 王勇 《国外电子测量技术》 北大核心 2023年第4期141-148,共8页
风电机异常数据检测对维护风电设备的稳定运行有着重要意义,为解决K-means算法随机指定初始点聚类和风电机数据异常问题,提出一种改进K-means算法的风电机数据异常检测方法。改进之后的方法,首先选择数据样本中位数作为第一个初始聚类中... 风电机异常数据检测对维护风电设备的稳定运行有着重要意义,为解决K-means算法随机指定初始点聚类和风电机数据异常问题,提出一种改进K-means算法的风电机数据异常检测方法。改进之后的方法,首先选择数据样本中位数作为第一个初始聚类中心,在选取下一个聚类中心时,距离当前n个聚类中心越远的点会有更高的概率被选为第n+1个聚类中心,进而达到聚类中心互相距离较远的目的,以此对风电机运行数据进行聚类,检测出离群点及异常点,保障风电设备稳定运行。 展开更多
关键词 k-MEANS算法 异常检测 初始聚类中心 风电机
下载PDF
基于结构系数的K-means初始聚类中心选择算法
14
作者 李汉波 魏福义 +3 位作者 张嘉龙 刘志伟 黄杰 方月宜 《计算机与数字工程》 2023年第5期993-996,1107,共5页
传统的K-means算法选取初始聚类中心时的不确定性会导致聚类结果不稳定。论文提出了基于相异度的邻域及其结构系数的概念,从最小的结构系数开始,按照其递增顺序寻找初始聚类中心;随后采用依次缩小邻域的技巧逐步探索,直到找到K个初始聚... 传统的K-means算法选取初始聚类中心时的不确定性会导致聚类结果不稳定。论文提出了基于相异度的邻域及其结构系数的概念,从最小的结构系数开始,按照其递增顺序寻找初始聚类中心;随后采用依次缩小邻域的技巧逐步探索,直到找到K个初始聚类中心。该方法同时得到li(i=0,1,2,…,q)个初始聚类中心及其对应的数据分类结果。实验证明,对比于以往的算法,新算法具有更高的分类准确率以及更少的迭代次数。 展开更多
关键词 k-MEANS聚类 相异度 初始聚类中心 结构系数
下载PDF
非独立同分布下的K-Modes算法
15
作者 周慧鑫 姜合 王艳梅 《计算机工程与设计》 北大核心 2023年第1期182-187,共6页
传统的K-Modes算法中,初始聚类中心是随机选取的,聚类结果过分依赖初始聚类中心的选择,影响聚类效果。在很多K-Modes算法的研究中假设数据是独立同分布的,在现实的数据中,数据对象和属性之间是根据某些耦合关系彼此关联的,是非独立同分... 传统的K-Modes算法中,初始聚类中心是随机选取的,聚类结果过分依赖初始聚类中心的选择,影响聚类效果。在很多K-Modes算法的研究中假设数据是独立同分布的,在现实的数据中,数据对象和属性之间是根据某些耦合关系彼此关联的,是非独立同分布的。针对这两方面问题,通过基于层次聚类进行预聚类的方法改进选取初始中心的方法,引入非独立同分布思想计算相异度量,进行实验验证。实验结果表明,通过改进初始中心的选取方法和相异度量的计算方法很好改进了K-Modes算法,提高了算法的聚类精度。 展开更多
关键词 k-Modes算法 初始中心 独立同分布 非独立同分布 耦合关系 层次聚类 相异度度量
下载PDF
基于人工蜂群的三支k-means聚类算法 被引量:4
16
作者 徐天杰 王平心 杨习贝 《计算机科学》 CSCD 北大核心 2023年第6期116-121,共6页
聚类在数据挖掘技术中起着至关重要的作用。传统的聚类算法都是硬聚类算法,即对象要么属于一个类,要么不属于一个类,在处理不确定数据时,强制划分会带来决策错误。三支k-means聚类算法可以对边界不确定数据进行更加合理的分类,但仍然存... 聚类在数据挖掘技术中起着至关重要的作用。传统的聚类算法都是硬聚类算法,即对象要么属于一个类,要么不属于一个类,在处理不确定数据时,强制划分会带来决策错误。三支k-means聚类算法可以对边界不确定数据进行更加合理的分类,但仍然存在对初始聚类中心敏感的问题。为解决这一问题,将人工蜂群算法与三支k-means聚类算法相结合,提出了一种基于人工蜂群的三支k-means聚类算法。通过定义类内聚集度函数和类间离散度函数来构造蜜源的适应度函数,引导蜂群向高质量的蜜源进行全局搜索。利用蜂群之间不同角色的相互协作与互换,对数据集进行多次迭代聚类,找到最优的蜜源位置,作为初始聚类中心,并在此基础上交替迭代聚类。实验证明,该方法对聚类结果的性能指标有所提高。在UCI数据集上的实验验证了该算法的有效性。 展开更多
关键词 三支k-means聚类算法 人工蜂群算法 适应度函数 初始聚类中心 蜜源
下载PDF
基于K-means决策树融合算法的医院财务共享中心管理策略研究
17
作者 李垚 杨蕊 +1 位作者 何宝林 李国忠 《现代科学仪器》 2023年第6期241-246,共6页
自最近一次人工智能技术革命以来,智能计算机技术被广泛应用于各行各业。在医院财务管理领域,基于智能计算机技术构建的财务共享中心能起到大幅提升医院财务管理效率并减少决策失误作用。此次研究构建了融合K-means与C4.5决策树算法的... 自最近一次人工智能技术革命以来,智能计算机技术被广泛应用于各行各业。在医院财务管理领域,基于智能计算机技术构建的财务共享中心能起到大幅提升医院财务管理效率并减少决策失误作用。此次研究构建了融合K-means与C4.5决策树算法的绩效评价优化和违规预测模型,并以某医院财务共享中心为对象为例,构建了基于大数据智能化的财务共享中心运营管理优化模型。测试结果显示,此次研究提出的基于改进K-means决策树算法的医院人员评价模型,较基于K-means++、经典K-means绩效评价模型,轮廓系数最大,为0.743,可见该模型聚类效果最好,而基于C4.5决策树构建的违规操作预测模型也具有良好的预测分类效果。 展开更多
关键词 k-MEANS C4.5决策树 财务共享中心 管理策略
下载PDF
K-means算法的初始值选取问题的研究
18
作者 姚蒙 何鹏程 《福建电脑》 2023年第7期57-61,共5页
随着数据爆发式的增长,数据挖掘算法的使用更加频繁,因此选取合适的数据挖掘算法进行数据分析是非常有必要的。本文对确定K-means算法初始值的问题,提出了一种数据预处理的优化方案。通过对目标数据集进行Canopy算法处理,并对Canopy算... 随着数据爆发式的增长,数据挖掘算法的使用更加频繁,因此选取合适的数据挖掘算法进行数据分析是非常有必要的。本文对确定K-means算法初始值的问题,提出了一种数据预处理的优化方案。通过对目标数据集进行Canopy算法处理,并对Canopy算法执行后的分组进行降噪、合并,以最终的分组个数作为K-means算法的分组K值,并以各分组的重心作为初始聚类重心,从而确定K-means算法的初始值。对比实验的结果显示,优化后的K-means算法具有更好的聚类效果。 展开更多
关键词 数据挖掘 k-MEANS算法 Canopy算法 聚类中心
下载PDF
基于改进K-均值算法的图书馆图书个性化推荐技术研究
19
作者 高康月 《现代科学仪器》 2023年第5期186-191,共6页
为提升图书馆服务质量,对图书个性化推荐技术进行研究。对传统K-均值算法存在的聚类数目选择与初始聚类中心确定困难问题,设定聚类数目范围,通过迭代自适应确定聚类数目,同时基于密度来确定初始聚类中心,实现对算法的改进。将改进K-均... 为提升图书馆服务质量,对图书个性化推荐技术进行研究。对传统K-均值算法存在的聚类数目选择与初始聚类中心确定困难问题,设定聚类数目范围,通过迭代自适应确定聚类数目,同时基于密度来确定初始聚类中心,实现对算法的改进。将改进K-均值聚类算法应用于高校图书馆图书个性化推荐中,和传统K-均值聚类算法对比结果表明:当迭代步数为10时,改进K均值算法的挖掘精度相对于传统K均值算法的挖掘精度提高了11.0%;当迭代次数增加到20时,两种算法的挖掘精度相差仅为1.6%,但改进K均值算法所用时间减少了92.1%,迭代效率大大提升。这对提升高校图书馆服务水平具有一定的参考价值。 展开更多
关键词 k-均值聚类算法 聚类数目 聚类中心 图书个性化推荐
下载PDF
基于MapReduce的大规模网络社区发现算法
20
作者 王瀚橙 戴海鹏 +2 位作者 陈志鹏 陈树森 陈贵海 《计算机科学》 CSCD 北大核心 2024年第4期11-18,共8页
社区发现是社会网络挖掘领域的基本问题。随着海量数据的迅速产生,传统社区发现算法愈发难以处理大规模社会网络。因此,针对大规模网络设计高效的社区发现算法意义重大。文中提出了一种基于MapReduce和k中心聚类的新型分布式算法。首先... 社区发现是社会网络挖掘领域的基本问题。随着海量数据的迅速产生,传统社区发现算法愈发难以处理大规模社会网络。因此,针对大规模网络设计高效的社区发现算法意义重大。文中提出了一种基于MapReduce和k中心聚类的新型分布式算法。首先,该算法提出“朋友圈系数”技术,该技术可更加准确地度量结点间的距离。其次,该算法提出“两阶段k中心聚类”技术,该技术在选取中心点过程中融入结点中心度启发式信息,可显著优化输出结果的模块度。最后,该算法提出“以模块度为优化目标的社区融合”技术,该技术能够在无先验知识的前提下自动确定网络中的社区数目。实验结果表明,所提算法的社区发现结果模块度明显优于最先进的社区发现算法。例如,相比LPA算法,其将模块度平均提升9.19倍。 展开更多
关键词 社区发现 k中心聚类 分布式计算 数据挖掘 大数据
下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部