期刊文献+
共找到209篇文章
< 1 2 11 >
每页显示 20 50 100
基于流形结构的多聚类中心近邻传播聚类算法
1
作者 陈雷雷 葛洪伟 +1 位作者 杨金龙 袁运浩 《计算机工程与应用》 CSCD 北大核心 2016年第6期67-73,共7页
多聚类中心近邻传播聚类算法(MEAP),在处理任意形状具有流形分布结构的数据时,往往得不到理想的聚类结果。为此,基于流形学习的思想,设计了一种全新的相似性度量,该相似性度量能够扩大位于同一流形中数据点间的相似性,同时缩小处于不同... 多聚类中心近邻传播聚类算法(MEAP),在处理任意形状具有流形分布结构的数据时,往往得不到理想的聚类结果。为此,基于流形学习的思想,设计了一种全新的相似性度量,该相似性度量能够扩大位于同一流形中数据点间的相似性,同时缩小处于不同流形上数据点间的相似性,从而使得相似性矩阵能够准确地反映数据集内在的流形分布结构。将该相似性度量与MEAP相结合,提出基于流形结构的多聚类中心近邻传播聚类算法MS-MEAP(Manifold Structure based Multi-Exemplar Affinity Propagation),从而有效地拓展了算法处理任意形状具有流形分布结构数据集的能力,同时提高了算法的运行效率。在人工数据集与USPS手写体数据集上进行了实验,仿真实验结果及算法有效性分析证明,MS-MEAP算法相比于原算法在处理任意形状具有流形分布结构的数据时,具有更好的聚类性能。 展开更多
关键词 近邻传播 多聚类中心近邻传播聚类 基于密度的 流形结构 相似性度量
下载PDF
基于近邻传播聚类-K均值聚类的工业用户用电模式挖掘方法
2
作者 宗一 郑罡 南钰 《科技资讯》 2024年第12期34-36,共3页
为了充分发挥用户负荷的可调节潜力,提出了一种基于近邻传播聚类-K均值聚类的工业用户用电模式挖掘方法。首先,比较K均值聚类和近邻传播聚类-K均值聚类的优缺点。在工业用户的选取上,选择最佳聚类数均为3的工业用户负荷数据作为被分析... 为了充分发挥用户负荷的可调节潜力,提出了一种基于近邻传播聚类-K均值聚类的工业用户用电模式挖掘方法。首先,比较K均值聚类和近邻传播聚类-K均值聚类的优缺点。在工业用户的选取上,选择最佳聚类数均为3的工业用户负荷数据作为被分析对象以便聚类,借助MATLAB工具对用户负荷数据进行聚类,得到了3组所需的聚类中心,再绘制成曲线以便观察和后续提取特征指标。 展开更多
关键词 近邻传播-K均值 工业用户 可调节潜力评估 评估指标体系 多准则决策法
下载PDF
基于近邻传播聚类的电商商品信息个性化推送研究
3
作者 张博君 《中国信息界》 2024年第2期246-248,共3页
引言.在当今数字化时代的电商环境中,向用户提供个性化的商品信息推送成为关键任务。近邻传播聚类是一种先进的数据聚类方法,可以有效地对用户和商品信息进行分类,实现精准的个性化推送。近邻传播聚类是一种基于数据相似性的聚类算法,... 引言.在当今数字化时代的电商环境中,向用户提供个性化的商品信息推送成为关键任务。近邻传播聚类是一种先进的数据聚类方法,可以有效地对用户和商品信息进行分类,实现精准的个性化推送。近邻传播聚类是一种基于数据相似性的聚类算法,能够在海量数据中发掘出数据的内在结构,为电商商品信息个性化推送提供有力支持。为了更好地应用近邻传播聚类算法进行电商商品信息个性化推送,本文开发了一种基于近邻传播聚类的电商商品信息个性化推送系统[1]。 展开更多
关键词 近邻传播 个性化推送 数据 算法 数据相似性 海量数据 数字化时代 商品信息
下载PDF
基于近邻传播聚类的多源异构数据信息个性化推送方法
4
作者 谢梦怡 《信息技术与信息化》 2024年第7期165-169,共5页
在处理多源异构数据、大规模数据时,传统的推送方法倾向于根据整体数据趋势和热门程度进行推送,未能根据具体数据特征和用户行为进行细致区分,因此推送内容可能过于泛泛,缺乏针对性。为此,提出一种基于近邻传播聚类的多源异构数据信息... 在处理多源异构数据、大规模数据时,传统的推送方法倾向于根据整体数据趋势和热门程度进行推送,未能根据具体数据特征和用户行为进行细致区分,因此推送内容可能过于泛泛,缺乏针对性。为此,提出一种基于近邻传播聚类的多源异构数据信息个性化推送方法。使用网络爬虫技术,获取用户在网络上的信息浏览行为数据,对这些数据进行分析,构建用户偏好模型。为了提升数据质量,采用空间滤波法对多源异构数据信息进行去噪处理。通过对数据进行标准化处理,消除数据的多源异构特性,使其具有可比性。在此基础上,运用主成分分析法进一步提取多源异构数据信息的核心特征。利用邻近传播聚类算法,对数据特征和用户偏好进行聚类分析,将具有相似性的数据或用户偏好归为一类。基于这些聚类结果,实现个性化的内容推送。经过实验验证,所设计的信息推送方法展现出极高的适配度和点击率,均超过95%。这一成果充分证明了所提出的方法能够实现对多源异构数据信息的个性化精准推送,为用户提供更加精准、贴心的信息服务。 展开更多
关键词 近邻传播 多源异构数据信息 个性化推送 空间滤波法 主成分分析法
下载PDF
基于近邻传播聚类与LSTNet的分布式光伏电站群短期功率预测 被引量:15
5
作者 王晓霞 俞敏 +1 位作者 霍泽健 杨迪 《电力系统自动化》 EI CSCD 北大核心 2023年第6期133-141,共9页
为了应对分布式光伏渗透率不断提高带给电网运行的挑战,提出了一种基于近邻传播聚类与长短期时间序列网络(LSTNet)的区域分布式光伏电站群短期功率预测模型。首先,利用近邻传播算法划分区域内不同季节的分布式光伏电站群,并通过皮尔逊... 为了应对分布式光伏渗透率不断提高带给电网运行的挑战,提出了一种基于近邻传播聚类与长短期时间序列网络(LSTNet)的区域分布式光伏电站群短期功率预测模型。首先,利用近邻传播算法划分区域内不同季节的分布式光伏电站群,并通过皮尔逊相关系数确定光伏出力的强相关气象因子,结合双线性插值法加密对应光伏电站群的气象数据。然后,通过LSTNet挖掘光伏功率和气象因子序列的长期和短期时空依赖,并叠加自回归的线性分量,实现了群内多个光伏电站的同时预测。最后,利用美国国家能源部可再生能源实验室的实测数据集验证了所提方法的有效性。实验比较表明,所提预测模型具有较高的预测精度和鲁棒性。 展开更多
关键词 分布式光伏电站群 短期功率预测 近邻传播 长短期时间序列网络
下载PDF
基于边界剥离思想的全局中心聚类算法
6
作者 程明畅 敖兰 刘浏 《郑州大学学报(工学版)》 CAS 北大核心 2024年第5期86-94,共9页
全局中心聚类算法如k-means、谱聚类在类簇分布出现重叠粘连现象时往往容易陷入局部最优且参数难以设定,极大地限制了全局中心聚类算法在实际应用中的效果。为解决此问题,提出了一种基于边界剥离思想的全局中心聚类算法。首先,设计了一... 全局中心聚类算法如k-means、谱聚类在类簇分布出现重叠粘连现象时往往容易陷入局部最优且参数难以设定,极大地限制了全局中心聚类算法在实际应用中的效果。为解决此问题,提出了一种基于边界剥离思想的全局中心聚类算法。首先,设计了一步边界剥离法,根据样本点间的反向k近邻关系定义了一种局部距离加权密度,并利用密度经验分布函数一阶差分最大处的密度值作为阈值将数据集分为边界集与核心集。其次,嵌入传统的全局中心聚类算法对核心集进行聚类,得益于核心集的簇间重叠问题已明显改善,嵌入算法将更容易收敛到真实的簇中心。最后,提出一种边界吸引算法,从已被归类的核心集样本点出发,借助已有的反向k近邻关系迭代融合边界集中的样本点以完成对整个数据集的聚类。相较于目前以迭代方式进行的边界剥离算法,所提算法在计算效率上具有明显优势,不需要额外设定复杂的终止条件而直接通过阈值进行边界划分,并且全局性方法在数据局部密度存在差异的情形下具备更强的鲁棒性。在实验阶段,采用3个合成数据集以及6个真实数据集从算法性能、参数敏感性、时间消耗多个方面进行评估,实验结果进一步验证了此算法的有效性与实用性。 展开更多
关键词 全局中心算法 边界剥离 簇重叠 反向k近邻 经验分布
下载PDF
基于近邻传播聚类方法的大学生计算思维能力评价模型
7
作者 刘俊娟 闫培玲 张赟 《信息与电脑》 2023年第20期1-3,共3页
在大学生计算思维能力评价中,评价指标具有较强的主观性,缺少具体的评价标准,导致评价结果不可靠。为此,提出基于近邻传播聚类方法的大学生计算思维能力评价模型。首先,以大学生内部因素为主要影响因素,确定一级评价指标和二级评价指标... 在大学生计算思维能力评价中,评价指标具有较强的主观性,缺少具体的评价标准,导致评价结果不可靠。为此,提出基于近邻传播聚类方法的大学生计算思维能力评价模型。首先,以大学生内部因素为主要影响因素,确定一级评价指标和二级评价指标,将其作为聚类算法的样本数据。其次,利用近邻传播聚类方法处理指标数据,建立大学生计算思维能力评价模型。最后,进行实验分析。实验结果表明,该模型的分析误差小,评价结果准确,优于对照组。 展开更多
关键词 近邻传播 计算思维 能力评价模型
下载PDF
跳跃跟踪SSA交叉迭代AP聚类算法
8
作者 黄鹤 李文龙 +3 位作者 杨澜 王会峰 高涛 陈婷 《电子学报》 EI CAS CSCD 北大核心 2024年第3期977-990,共14页
针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入... 针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入者位置更新不足的问题,设计了一种跳跃跟踪优化策略,通过考虑偏好阻尼因子的跳跃策略设计大步长更新发现者,增加麻雀搜索算法的全局勘探能力和寻优速度,加入者设计动态小步长跟踪领头雀更新位置,同时,利用自适应种群划分机制更新发现者和加入者的比重,增加算法的后期局部开发能力和寻优速度;其次,设计基于扰动因子的Tent映射,在此基础上增加3个参数,使映射分布范围增大,并避免了陷入小周期点和不稳周期点;最后,引入轮廓系数作为评价函数,跳跃跟踪麻雀搜索算法自动寻找较优的p和λ,代替手动输入参数,并融合基于扰动因子的Tent映射优化近邻传播算法,交叉迭代确定最优簇数.使用多种算法聚类University of California Irvine数据集的10种公共数据集,仿真结果表明,本文提出的聚类算法与经典近邻传播算法、基于差分改进的仿射传播聚类算法、基于麻雀搜索算法优化的近邻传播聚类算法和进化近邻传播算法相比具有更优的搜索效率以及聚类精度.对国家信息数据进行了聚类分析,提出的方法更加准确有效合理,具有较好的应用价值. 展开更多
关键词 近邻传播 改进Tent映射 改进麻雀搜索算法 轮廓系数 数据集
下载PDF
结合近邻传播聚类的世界生成神经网络优化器
9
作者 陆敏芳 宗伟 +3 位作者 陈美涵 杨波 王琳 张波 《济南大学学报(自然科学版)》 CAS 北大核心 2023年第4期449-456,共8页
为了解决黑盒问题优化领域中传统优化算法在学习问题结构时存在缺乏样本多样性的问题,设计结合近邻传播聚类的世界生成神经网络优化器。该优化器通过独特的世界模型与采样生成器进行协同学习,完成对问题结构的学习并生成更加多样化的解... 为了解决黑盒问题优化领域中传统优化算法在学习问题结构时存在缺乏样本多样性的问题,设计结合近邻传播聚类的世界生成神经网络优化器。该优化器通过独特的世界模型与采样生成器进行协同学习,完成对问题结构的学习并生成更加多样化的解,以此为基础提出新的优化算法;将所提出的算法与5种有代表性的算法在12个不同特征的优化问题上进行多角度的对比。结果表明,结合近邻传播聚类的世界生成神经网络优化器在不同特征基准问题上平均性能达到最优,准确度平均排名第一,证明了结合近邻传播聚类的世界生成神经网络优化器在学习问题结构的有效性,同时增加了样本的多样性。 展开更多
关键词 近邻传播 世界生成神经网络 黑盒问题 世界模型 神经网络 协同学习
下载PDF
基于多聚类中心的加权聚类铸体薄片图像分割方法
10
作者 郑洋洋 张冲 +1 位作者 伍薇 焦立群 《矿物岩石地球化学通报》 CAS CSCD 北大核心 2023年第4期882-889,共8页
针对人工利用显微镜对岩石铸体薄片进行鉴定的低效和普通聚类分割算法对图像边缘分割效果差的问题,本文从岩石特征出发,提出了一种基于聚类分割算法的多聚类中心加权分割新方法,并使用该方法训练了一个适用于岩石铸体薄片的分割模型。... 针对人工利用显微镜对岩石铸体薄片进行鉴定的低效和普通聚类分割算法对图像边缘分割效果差的问题,本文从岩石特征出发,提出了一种基于聚类分割算法的多聚类中心加权分割新方法,并使用该方法训练了一个适用于岩石铸体薄片的分割模型。使用该模型可以快速地完成对大量薄片的鉴定任务。该方法通过构建新的聚类距离提升了对薄片各组分边缘和内部的分割效果,将多聚类中心的方法和加权的聚类方法相结合,进一步增强了对薄片边缘部分的分割。利用来自疏松岩心的铸体薄片图像进行分割实验,并将本文提出的聚类分割新方法与普通的聚类分割算法的结果进行比较,发现本文方法的分割误差比普通分割方法的误差最高降幅达37.2%。与现有深度学习分割算法对数据量和数据类型的高要求相比,多聚类中心的加权聚类分割算法更适合地质领域中的分割任务,具有较高的应用价值。 展开更多
关键词 多聚中心 均值 铸体薄片 图像分割
下载PDF
基于马氏距离的半监督近邻传播聚类算法 被引量:1
11
作者 文静 俞卫琴 《软件导刊》 2023年第7期59-65,共7页
针对近邻传播(AP)聚类算法距离度量的局限性,以及对于一些结构比较复杂的数据集聚类算法精度不高的问题,提出一种基于马氏距离的半监督近邻传播聚类算法(SAPBM)。考虑到马氏距离不受样本维数的影响,在样本的相似性度量中,SAPBM算法以马... 针对近邻传播(AP)聚类算法距离度量的局限性,以及对于一些结构比较复杂的数据集聚类算法精度不高的问题,提出一种基于马氏距离的半监督近邻传播聚类算法(SAPBM)。考虑到马氏距离不受样本维数的影响,在样本的相似性度量中,SAPBM算法以马氏距离取代了AP算法采用的欧几里得距离,减少因样本维数的影响造成样本间的相互干扰;结合成对约束信息改善数据间的相似度,使相似度矩阵更能准确反映数据间的关系。在UCI标准数据集上进行实验,结果表明,SAPBM算法相比传统的AP聚类算法和仅利用成对约束信息的SAP聚类算法的聚类性能更优。 展开更多
关键词 近邻传播 马氏距离 相似性度量 半监督 成对约束信息
下载PDF
基于近邻传播聚类的智能电网数据安全聚合
12
作者 徐飞 周远科 +3 位作者 章海峰 王智广 施晓敏 华传程 《电子设计工程》 2023年第19期108-112,共5页
针对因类间相似度较高导致智能电网数据聚合结果稳定性差的问题,提出了基于近邻传播聚类的智能电网数据安全聚合方法。构建基于近邻传播的聚类结构,将每个数据点归属到最近的代表点,以此搭建日场景样本间的相似度矩阵,将其作为评判聚类... 针对因类间相似度较高导致智能电网数据聚合结果稳定性差的问题,提出了基于近邻传播聚类的智能电网数据安全聚合方法。构建基于近邻传播的聚类结构,将每个数据点归属到最近的代表点,以此搭建日场景样本间的相似度矩阵,将其作为评判聚类中心的标准。引入了防震荡的衰减因子,初始化求解相似度矩阵,确定最佳聚类数。更新聚类结果,计算不同智能电网数据之间的相似度,设计智能电网数据安全聚合流程,实现数据安全聚合。由实验结果可知,该方法聚合程度始终高于0.70,聚合场景数量一致,说明智能电网数据安全聚合结果稳定。 展开更多
关键词 近邻传播 智能电网 数据安全 相似度
下载PDF
基于改进密度峰值算法的轨迹聚类
13
作者 钟超 刘漫丹 贺帆 《计算机工程与设计》 北大核心 2024年第1期130-138,共9页
为解决用户群体移动轨迹划分和密度峰值聚类算法自身局限性的问题,以校园轨迹为对象,考虑时间和位置语义信息层面的信息,建立网络用户间的相似性度量模型,提出一种基于共享近邻贡献度的密度峰值聚类算法(density peak clustering based ... 为解决用户群体移动轨迹划分和密度峰值聚类算法自身局限性的问题,以校园轨迹为对象,考虑时间和位置语义信息层面的信息,建立网络用户间的相似性度量模型,提出一种基于共享近邻贡献度的密度峰值聚类算法(density peak clustering based on shared nearest neighbor contribution,SNNC-DPC),结合信息熵理论,通过最小化局部密度熵自适应选择截断距离;在局部密度计算上,利用共享近邻贡献度重新计算局部密度,更加全面地反映数据分布的特性;采用非线性变换方法选取决策值,解决聚类中心选取困难且方法单一的问题。在真实校园轨迹数据集上实验,验证了改进算法的有效性。 展开更多
关键词 无线网络 密度峰值 语义信息 相似性度量 信息熵 中心 共享近邻贡献度
下载PDF
基于MapReduce的分布式近邻传播聚类算法 被引量:53
14
作者 鲁伟明 杜晨阳 +2 位作者 魏宝刚 沈春辉 叶振超 《计算机研究与发展》 EI CSCD 北大核心 2012年第8期1762-1772,共11页
随着信息技术迅速发展,数据规模急剧增长,大规模数据处理非常具有挑战性.许多并行算法已被提出,如基于MapReduce的分布式K平均聚类算法、分布式谱聚类算法等.近邻传播(affinity propagation,AP)聚类能克服K平均聚类算法的局限性,但是处... 随着信息技术迅速发展,数据规模急剧增长,大规模数据处理非常具有挑战性.许多并行算法已被提出,如基于MapReduce的分布式K平均聚类算法、分布式谱聚类算法等.近邻传播(affinity propagation,AP)聚类能克服K平均聚类算法的局限性,但是处理海量数据性能不高.为有效实现海量数据聚类,提出基于MapReduce的分布式近邻传播聚类算法——DisAP.该算法先将数据点随机划分为规模相近的子集,并行地用AP聚类算法稀疏化各子集,然后融合各子集稀疏化后的数据再次进行AP聚类,由此产生的聚类代表作为所有数据点的聚类中心.在人工合成数据、人脸图像数据、IRIS数据以及大规模数据集上的实验表明:DisAP算法对数据规模有很好的适应性,在保持AP聚类效果的同时可有效缩减聚类时间. 展开更多
关键词 近邻传播 分布式计算 MAPREDUCE 数据划分 融合
下载PDF
面向大规模数据的分层近邻传播聚类算法 被引量:14
15
作者 刘晓楠 尹美娟 +2 位作者 李明涛 姚东 陈武平 《计算机科学》 CSCD 北大核心 2014年第3期185-188,192,共5页
近邻传播(Affinity Propagation,AP)聚类具有不需要设定聚类个数、快速准确的优点,但无法适应于大规模数据的应用需求。针对此问题,提出了分层近邻传播聚类算法。首先,将待聚类数据集划分为若干适合AP算法高效执行的子集,分别推举出各... 近邻传播(Affinity Propagation,AP)聚类具有不需要设定聚类个数、快速准确的优点,但无法适应于大规模数据的应用需求。针对此问题,提出了分层近邻传播聚类算法。首先,将待聚类数据集划分为若干适合AP算法高效执行的子集,分别推举出各个子集的聚类中心;然后对所有子集聚类中心再次执行AP聚类,推举出整个数据集的全局聚类中心;最后根据与这些全局聚类中心的相似度对聚类样本进行划分,从而实现对大规模数据的高效聚类。在真实和模拟数据集上的实验结果均表明,与AP聚类和自适应AP聚类相比,该方法在保证较好聚类效果的同时,极大地降低了聚类的时间消耗。 展开更多
关键词 数据 近邻传播 分层推举 中心
下载PDF
一种基于自适应标记与区域间近邻传播聚类的分水岭图像分割算法 被引量:19
16
作者 蔡强 刘亚奇 +2 位作者 曹健 李海生 杜军平 《电子学报》 EI CAS CSCD 北大核心 2017年第8期1911-1918,共8页
分水岭算法是一种高效的图像分割算法,能够准确地对图像进行基于区域的分割,但是存在易过分割的问题.为此本文提出一种改进的分水岭算法:首先,对彩色图像进行频谱包络滤波并计算彩色梯度获得梯度图像,再采取一种自适应设定参数的H-minim... 分水岭算法是一种高效的图像分割算法,能够准确地对图像进行基于区域的分割,但是存在易过分割的问题.为此本文提出一种改进的分水岭算法:首先,对彩色图像进行频谱包络滤波并计算彩色梯度获得梯度图像,再采取一种自适应设定参数的H-minima技术,对梯度图像的极小值区域进行标记;然后,对已标记极小值区域的梯度图像进行分水岭分割;最后,计算分水岭分割所得各区域的颜色矩,作为该区域的颜色特征,并对这些区域进行近邻传播聚类获得分割结果.通过与近年来其它改进的分水岭算法和采用聚类的图像分割算法实验比较,本文所提算法能更加有效地抑制过分割,提高分割准确率,具有良好的自适应性和鲁棒性. 展开更多
关键词 分水岭算法 自适应标记 近邻传播 图像分割 过分割
下载PDF
基于密度与近邻传播的数据流聚类算法 被引量:28
17
作者 张建朋 陈福才 +1 位作者 李邵梅 刘力雄 《自动化学报》 EI CSCD 北大核心 2014年第2期277-288,共12页
针对现有算法聚类精度不高、处理离群点能力较差以及不能实时检测数据流变化的缺陷,提出一种基于密度与近邻传播融合的数据流聚类算法.该算法采用在线/离线两阶段处理框架,通过引入微簇衰减密度来精确反映数据流的演化信息,并采用在线... 针对现有算法聚类精度不高、处理离群点能力较差以及不能实时检测数据流变化的缺陷,提出一种基于密度与近邻传播融合的数据流聚类算法.该算法采用在线/离线两阶段处理框架,通过引入微簇衰减密度来精确反映数据流的演化信息,并采用在线动态维护和删减微簇机制,使算法模型更符合原始数据流的内在特性.同时,当模型中检测到新的类模式出现时,采用一种改进的加权近邻传播聚类(Weighted and hierarchical affinity propagation,WAP)算法对模型进行重建,因而能够实时检测到数据流的变化,并能给出任意时间的聚类结果.在真实数据集和人工数据集上的实验表明,该算法具有良好的适用性、有效性和可扩展性,能够取得较好的聚类效果. 展开更多
关键词 数据流挖掘 近邻传播 基于密度 变化检测
下载PDF
一种分层组合的半监督近邻传播聚类算法 被引量:15
18
作者 张震 汪斌强 +1 位作者 伊鹏 兰巨龙 《电子与信息学报》 EI CSCD 北大核心 2013年第3期645-651,共7页
针对近邻传播(AP)聚类算法的计算复杂度和准确性,该文提出一种分层组合的半监督近邻传播聚类算法(SAP-SC)。算法引入"分层聚类"的思想,将一次AP聚类过程等分成若干层聚类,使得处理过程简单、易于实现;每层只关注聚类"困... 针对近邻传播(AP)聚类算法的计算复杂度和准确性,该文提出一种分层组合的半监督近邻传播聚类算法(SAP-SC)。算法引入"分层聚类"的思想,将一次AP聚类过程等分成若干层聚类,使得处理过程简单、易于实现;每层只关注聚类"困难"的数据点,并通过构造"成对点约束"和使用"子簇标签映射"进行半监督学习;基于"组合提升"的方法将各层聚类结果加权叠加,从而提升了算法的准确性能。理论分析和实验结果表明:算法在聚类准确性和计算复杂度方面有了较大改进。 展开更多
关键词 半监督学习 近邻传播 分层 组合提升
下载PDF
基于近邻传播算法的最佳聚类数确定方法比较研究 被引量:30
19
作者 周世兵 徐振源 唐旭清 《计算机科学》 CSCD 北大核心 2011年第2期225-228,共4页
在聚类分析中,决定聚类质量的关键是确定最佳聚类数。提出采用聚类效果较好的近邻传播聚类算法对样本进行聚类,运用6种聚类有效性指标分别对聚类结果进行有效性分析,以确定最佳聚类数。具体分析了这些有效性指标,并改进了IGP指标确定最... 在聚类分析中,决定聚类质量的关键是确定最佳聚类数。提出采用聚类效果较好的近邻传播聚类算法对样本进行聚类,运用6种聚类有效性指标分别对聚类结果进行有效性分析,以确定最佳聚类数。具体分析了这些有效性指标,并改进了IGP指标确定最佳聚类数的方法。针对8个数据集,通过实验比较这些指标的性能。分析和实验结果表明,基于近邻传播聚类算法,IGP指标确定最佳聚类数的性能最好。 展开更多
关键词 近邻传播 有效性指标 分析
下载PDF
可变相似性度量的近邻传播聚类 被引量:49
20
作者 董俊 王锁萍 熊范纶 《电子与信息学报》 EI CSCD 北大核心 2010年第3期509-514,共6页
近邻传播(AP)聚类算法面临的一个问题是不适用于多重尺度及任意空间形状的数据聚类处理。该文从数据分布特性的表征出发,提出了一种改进的近邻传播聚类算法AP-VSM(Affinity Propagation based on Variable-Similarity Measure)。首先,... 近邻传播(AP)聚类算法面临的一个问题是不适用于多重尺度及任意空间形状的数据聚类处理。该文从数据分布特性的表征出发,提出了一种改进的近邻传播聚类算法AP-VSM(Affinity Propagation based on Variable-Similarity Measure)。首先,综合数据的全局与局部分布特性,设计了一种数据可变相似性度量计算方法,该度量可以有效地反映数据实际聚类的分布特性;然后在传统AP算法框架基础上,构造出基于可变相似性度量的近邻传播聚类算法,从而拓展了传统AP算法的数据处理能力。仿真实验验证了新方法性能优于传统AP算法。 展开更多
关键词 数据处理 分析 近邻传播 可变相似性度b量 流形分析
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部