期刊文献+
共找到140篇文章
< 1 2 7 >
每页显示 20 50 100
Interpolation and approximation for data living on manifold surfaces 被引量:1
1
作者 HU Jianping LIU Xiuping +1 位作者 WANG Xiaochao XIE Qi 《Computer Aided Drafting,Design and Manufacturing》 2012年第4期16-20,共5页
Meshed surfaces are ubiquitous in digital geometry processing and computer graphics. The set of attributes associated with each vertex such as the vertex locations, curvature, temperature, pressure or saliency, can be... Meshed surfaces are ubiquitous in digital geometry processing and computer graphics. The set of attributes associated with each vertex such as the vertex locations, curvature, temperature, pressure or saliency, can be recognized as data living on mani- fold surfaces. So interpolation and approximation for these data are of general interest. This paper presents two approaches for mani- fold data interpolation and approximation through the properties of Laplace-Beltrami operator (Laplace operator defined on a mani- fold surface). The first one is to use Laplace operator minimizing the membrane energy of a scalar function defined on a manifold. The second one is to use bi-Laplace operator minimizing the thin plate energy of a scalar function defined on a manifold. These two approaches can process data living on high genus meshed surfaces. The approach based on Laplace operator is more suitable for manifold data approximation and can be applied manifold data smoothing, while the one based on bi-Laplace operator is more suit- able for manifold data interpolation and can be applied image extremal envelope computation. All the application examples demon- strate that our procedures are robust and efficient. 展开更多
关键词 manifold data interpolation and approximation Laplace operator bi-Laplace operator manifold data smoothing imageextremal envelope computation
下载PDF
面向流形数据的加权自然近邻密度峰值聚类算法
2
作者 赵嘉 马清 +3 位作者 陈蔚昌 肖人彬 崔志华 潘正祥 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期652-660,669,共10页
流形数据由一些弧线形类簇组成,其特点是同一类簇的样本间距离较大.密度峰值聚类(DPC)算法具有简单高效的特点,但应对流形数据时表现不佳. DPC算法的两种密度度量标准可能造成不同程度的信息缺失,其分配策略仅参考距离和密度,致使聚类... 流形数据由一些弧线形类簇组成,其特点是同一类簇的样本间距离较大.密度峰值聚类(DPC)算法具有简单高效的特点,但应对流形数据时表现不佳. DPC算法的两种密度度量标准可能造成不同程度的信息缺失,其分配策略仅参考距离和密度,致使聚类精度不高.提出面向流形数据的加权自然近邻DPC(DPC-WNNN)算法,定义样本局部密度时,综合分析样本的局部和全局信息,引入加权的自然近邻以及逆近邻来应对高斯核或截断核的信息缺失问题.设计样本分配策略时通过引入共享近邻和共享逆近邻计算样本相似度,弥补DPC算法空间因素缺失的问题.将DPC-WNNN算法在流形数据集和真实数据集上与7种类似算法进行比较,结果表明该算法能更有效地找到类簇的中心点并准确分配样本,表现出良好的聚类性能. 展开更多
关键词 密度峰值 聚类 流形数据 自然近邻
下载PDF
Nonlinear Dimensionality Reduction and Data Visualization:A Review 被引量:4
3
作者 Hujun Yin 《International Journal of Automation and computing》 EI 2007年第3期294-303,共10页
Dimensionality reduction and data visualization are useful and important processes in pattern recognition. Many techniques have been developed in the recent years. The self-organizing map (SOM) can be an efficient m... Dimensionality reduction and data visualization are useful and important processes in pattern recognition. Many techniques have been developed in the recent years. The self-organizing map (SOM) can be an efficient method for this purpose. This paper reviews recent advances in this area and related approaches such as multidimensional scaling (MDS), nonlinear PC A, principal manifolds, as well as the connections of the SOM and its recent variant, the visualization induced SOM (ViSOM), with these approaches. The SOM is shown to produce a quantized, qualitative scaling and while the ViSOM a quantitative or metric scaling and approximates principal curve/surface. The SOM can also be regarded as a generalized MDS to relate two metric spaces by forming a topological mapping between them. The relationships among various recently proposed techniques such as ViSOM, Isomap, LLE, and eigenmap are discussed and compared. 展开更多
关键词 Dimensionality reduction nonlinear data projection multidimensional scaling self-organizing maps nonlinear PCA principal manifold
下载PDF
大坝安全监测数据降噪的流形学习方法
4
作者 冯燕明 何杨杨 +3 位作者 左生龙 张帅 徐朗 苏怀智 《水利水电科技进展》 CSCD 北大核心 2024年第4期59-64,共6页
针对大坝变形、渗流、应力应变等安全监测数据难以避免受到噪声污染,且传统线性降噪方法去噪效果不佳的问题,提出了基于相空间重构与流形学习相组合的大坝安全监测数据非线性降噪方法。该方法在重构大坝安全监测数据时间序列相空间的基... 针对大坝变形、渗流、应力应变等安全监测数据难以避免受到噪声污染,且传统线性降噪方法去噪效果不佳的问题,提出了基于相空间重构与流形学习相组合的大坝安全监测数据非线性降噪方法。该方法在重构大坝安全监测数据时间序列相空间的基础上,通过交叉应用局部切空间排列方法与极大似然估计、自适应邻域等方法,以重构的相空间为桥梁,提取大坝安全监测数据序列深层次信息,得到降噪后的大坝安全监测数据。工程实测数据验证结果表明,相比小波软阈值法和固定邻域-LTSA法,本文提出的方法降噪效果更优,具有一定的工程应用价值。 展开更多
关键词 大坝安全 监测数据 降噪处理 流形学习 相空间重构
下载PDF
基于黎曼流形的健身APP风险度量方法
5
作者 宋策 赵小林 +2 位作者 谢昆 刘晓然 李彬涵 《首都体育学院学报》 CSSCI 北大核心 2024年第5期497-504,共8页
随着智能设备的普及,其应用系统已成为恶意软件攻击的主要目标,存在巨大的网络安全隐患。健身App因其获取数据的隐私性和敏感性,面临的数据安全问题更加严峻,其安全度量模型成为解决这一挑战的关键点。目前的安全度量模型多数基于静态... 随着智能设备的普及,其应用系统已成为恶意软件攻击的主要目标,存在巨大的网络安全隐患。健身App因其获取数据的隐私性和敏感性,面临的数据安全问题更加严峻,其安全度量模型成为解决这一挑战的关键点。目前的安全度量模型多数基于静态特征构建,未能全面考虑智能设备的动态网络行为。为了弥补这一不足,提出一种基于网络行为的健身App安全度量模型,运用协方差矩阵对网络空间进行转换,提高了对恶意软件攻击识别的准确率,根据健身App的动态网络行为特征,更全面地揭示了其安全状态,同时结合黎曼度量,有效描述了网络安全风险,并计算其值,从而构建出一个基于恶意软件攻击识别与黎曼流形的风险度量模型,以实现更安全的数据保护。 展开更多
关键词 数据安全 网络行为 黎曼流形 风险度量模型 协方差矩阵
下载PDF
基于多样化流形学习的非线性矩阵分解数据聚类
6
作者 郑淦专 李原浩 《计算机应用与软件》 北大核心 2024年第11期309-318,共10页
为了捕获多方面数据中的局部几何结构,提升聚类性能,提出一种基于多样化流形学习的非线性矩阵分解数据聚类方法。为每一种相互关系构造一个P近邻图,以捕获两种不同类型的密切相关对象,从而准确地学习在数据的内部关系和内部关系上产生... 为了捕获多方面数据中的局部几何结构,提升聚类性能,提出一种基于多样化流形学习的非线性矩阵分解数据聚类方法。为每一种相互关系构造一个P近邻图,以捕获两种不同类型的密切相关对象,从而准确地学习在数据的内部关系和内部关系上产生的多个流形,并在用非线性矩阵分解映射到新的低维数据空间时稳定地保持所学习的多样流形。多个数据集聚类结果表明该方法能够充分挖掘各种相关类型的部分表示,在精度和效率上均具备一定优势。 展开更多
关键词 多面数据 聚类 流形学习 P近邻图
下载PDF
基于局部图嵌入加权罚SVM的模拟电路故障诊断方法 被引量:14
7
作者 廖剑 史贤俊 +1 位作者 周绍磊 肖支才 《电工技术学报》 EI CSCD 北大核心 2016年第4期28-35,共8页
针对传统支持向量机(SVM)在模拟电路故障诊断应用中存在的不足,提出一种基于局部图嵌入加权罚支持向量机(LGEWP-SVM)的模拟电路故障诊断新方法。通过在保持数据整体类间间隔最大化的基础上优化数据流形的局部分布,同时在惩罚系数中引入... 针对传统支持向量机(SVM)在模拟电路故障诊断应用中存在的不足,提出一种基于局部图嵌入加权罚支持向量机(LGEWP-SVM)的模拟电路故障诊断新方法。通过在保持数据整体类间间隔最大化的基础上优化数据流形的局部分布,同时在惩罚系数中引入数据的全局分布信息,设计了一种依赖于数据分布的新型支持向量机。该方法有效融合了数据的先验分布信息,增强了算法的抗干扰能力,提高了模型的诊断准确度。实验结果验证了所提方法的有效性。 展开更多
关键词 模拟电路 故障诊断 支持向量机 数据流形
下载PDF
基于流形距离的量子进化聚类算法 被引量:16
8
作者 李阳阳 石洪竺 +1 位作者 焦李成 马文萍 《电子学报》 EI CAS CSCD 北大核心 2011年第10期2343-2347,共5页
基于量子计算的机理和特性,并结合进化计算,本文提出了一种新颖的量子进化聚类算法(QEAM),在该聚类算法中引入了一种新的距离测度函数——流形距离.新方法将聚类归属为优化问题,通过运用量子进化的机理更快地搜索到最优聚类中心,从而得... 基于量子计算的机理和特性,并结合进化计算,本文提出了一种新颖的量子进化聚类算法(QEAM),在该聚类算法中引入了一种新的距离测度函数——流形距离.新方法将聚类归属为优化问题,通过运用量子进化的机理更快地搜索到最优聚类中心,从而得到最优隶属度矩阵划分;同时,通过基于流形距离的相似性度量,有效利用样本所具有的全局一致性信息,充分挖掘样本的空间分布信息,对样本进行正确的类别划分.将本文算法(QEAM)与基于流形距离的免疫进化算法(IEAM),遗传聚类算法(GAC)以及模糊C-均值算法(FCM)进行了性能比较,对6个人工数据集和3个UCI数据集的仿真实验结果显示,QEAM对样本空间分布复杂的聚类问题具有较高的准确率和较好的鲁棒性. 展开更多
关键词 量子计算 量子进化算法 数据聚类 流形距离
下载PDF
非线性流形上的线性结构聚类挖掘 被引量:3
9
作者 王力 吴成东 +2 位作者 陈东岳 李孟歆 陈莉 《自动化学报》 EI CSCD 北大核心 2012年第8期1308-1320,共13页
针对非线性数据流形的线性结构挖掘问题,提出一种基于Grassmann流形和蚁群方法的聚类算法.为抑制噪声对线性结构探测的影响,对含噪数据集进行算法处理最小单元提升,利用Grassmann流形定义提升后单元间相似度,同时设计了一种类测地距离... 针对非线性数据流形的线性结构挖掘问题,提出一种基于Grassmann流形和蚁群方法的聚类算法.为抑制噪声对线性结构探测的影响,对含噪数据集进行算法处理最小单元提升,利用Grassmann流形定义提升后单元间相似度,同时设计了一种类测地距离作为簇连通性约束.为提高蚁群解的线性结构挖掘质量,提出了曲面复杂度最小方向定义,并将其作为信息素更新的启发信息引入.在多个数据集上的实验和分析表明,与K-means、Geodesic K-means以及有限混合模型(Finite mixture model,FMM)等传统算法相比,本文算法具备挖掘非线性流形上线性结构的新特性,并且能够保证线性结构内部的连通性. 展开更多
关键词 数据流形 线性结构 GRASSMANN 流形 蚁群聚类 流形假设
下载PDF
流形判别分析和支持向量机的恒星光谱数据自动分类方法 被引量:3
10
作者 刘忠宝 王召巴 赵文娟 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2014年第1期263-266,共4页
尽管经典的分类方法支持向量机SVM在天文学领域广泛应用,但其只考虑类间的绝对间隔而忽略类内的分布性状,因而分类性能有待于进一步提升。鉴于此,提出一种新颖的基于流形判别分析和支持向量机的恒星光谱数据自动分类方法。该方法引入流... 尽管经典的分类方法支持向量机SVM在天文学领域广泛应用,但其只考虑类间的绝对间隔而忽略类内的分布性状,因而分类性能有待于进一步提升。鉴于此,提出一种新颖的基于流形判别分析和支持向量机的恒星光谱数据自动分类方法。该方法引入流形判别分析的两个重要概念:基于流形的类内离散度MW和基于流形的类间离散度MB。所提方法找到的分类面同时保证MW最小且MB最大。可建立相应最优化问题,然后将原最优化问题转化为QP对偶形式求得支持向量和判别函数,最后利用判别函数判断测试样本的类属。该方法的最大优势在于进行分类决策时,不仅考虑样本的类间信息和分布特征,而且还保持了各类的局部流形结构。SDSS恒星光谱数据上的比较实验表明该方法的有效性。 展开更多
关键词 自动分类 恒星光谱数据 流形判别分析 支持向量机
下载PDF
基于邻域优化的局部线性嵌入 被引量:2
11
作者 文贵华 江丽君 文军 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第13期3119-3122,共4页
利用图代数计算数据之间的相关性,进而优化数据的局部邻域,并应用于改进局部线性嵌入.LLE算法。优化后的LLE算法考虑了数据集的聚类结构,但不需要分类信息或聚类算法做预处理,因而算法是无监督的,有通用性,简单易于实现。邻域优化后的... 利用图代数计算数据之间的相关性,进而优化数据的局部邻域,并应用于改进局部线性嵌入.LLE算法。优化后的LLE算法考虑了数据集的聚类结构,但不需要分类信息或聚类算法做预处理,因而算法是无监督的,有通用性,简单易于实现。邻域优化后的局部线性嵌入算法克服了经典LLE不能很好地处理稀疏或含有噪音数据的缺陷。同时继承了经典LLE时间复杂度低的优点,可用于解决大规模数据问题。标准数据集上的实验结果证明了所提方法的有效性。 展开更多
关键词 数据流形 局部线性嵌入 图代数 邻域结构
下载PDF
基于流形排序的动态过抽样方法研究 被引量:2
12
作者 杨杰明 乔媛媛 +2 位作者 王林 曲朝阳 刘海洋 《计算机应用研究》 CSCD 北大核心 2017年第6期1659-1662,1667,共5页
针对传统过抽样容易出现数据冗余和局限于处理静态数据的问题,提出一种基于流形排序的动态过抽样方法。该方法采用流形结构描述数据,根据数据内在的全局流形结构对少数类数据进行排序,选择出排序值高的数据执行重采样策略,以达到改善数... 针对传统过抽样容易出现数据冗余和局限于处理静态数据的问题,提出一种基于流形排序的动态过抽样方法。该方法采用流形结构描述数据,根据数据内在的全局流形结构对少数类数据进行排序,选择出排序值高的数据执行重采样策略,以达到改善数据平衡度的目的。实验结果表明,在动态的不平衡数据集上,该方法获得了比当前同类方法更好的分类效果,还能有效提升分类器对少数类的识别性能。 展开更多
关键词 不平衡数据 流形排序 过抽样
下载PDF
基于流形模糊双支持向量机的恒星光谱分类方法 被引量:4
13
作者 刘忠宝 高艳云 王建珍 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2015年第1期263-266,共4页
支持向量机(support vector machine,SVM)具有良好的学习性能和泛化能力,因而被广泛应用于恒星光谱分类中。然而实际应用面临的数据规模往往很大,SVM便暴露出计算量大、分类速度慢等问题。为了解决上述问题,Jayadeva等提出双支持向量机(... 支持向量机(support vector machine,SVM)具有良好的学习性能和泛化能力,因而被广泛应用于恒星光谱分类中。然而实际应用面临的数据规模往往很大,SVM便暴露出计算量大、分类速度慢等问题。为了解决上述问题,Jayadeva等提出双支持向量机(twin support vector machine,TWSVM),将计算时间减少至SVM的1/4。然后上述方法仅关注数据的全局特征,对每类数据的局部特征并未关注。鉴于此,提出基于流形模糊双支持向量机(manifold fuzzy twin support vector machine,MF-TSVM)的恒星光谱分类方法。利用流形判别分析获得数据的全局特征和局部特征,模糊隶属度函数的引入将各类数据区别对待,尽可能减少噪声点和奇异点对分类结果的影响。与C-SVM,KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明了该方法的有效性。 展开更多
关键词 自动分类 恒星光谱 流形判别分析 模糊隶属度 双支持向量机
下载PDF
面向大数据流的半监督在线多核学习算法 被引量:8
14
作者 张钢 谢晓珊 +1 位作者 黄英 王春茹 《智能系统学报》 CSCD 北大核心 2014年第3期355-363,共9页
在机器学习中,核函数的选择对核学习器性能有很大的影响,而通过核学习的方法可以得到有效的核函数。提出一种面向大数据流的半监督在线核学习算法,通过当前读取的大数据流片段以在线方式更新当前的核函数。算法通过大数据流的标签对核... 在机器学习中,核函数的选择对核学习器性能有很大的影响,而通过核学习的方法可以得到有效的核函数。提出一种面向大数据流的半监督在线核学习算法,通过当前读取的大数据流片段以在线方式更新当前的核函数。算法通过大数据流的标签对核函数参数进行有监督的调整,同时以无监督的方式通过流形学习对核函数参数进行修改,以使得核函数所体现的等距面尽可能沿着数据的某种低维流形分布。算法的创新性在于能同时进行有监督和无监督的核学习,且不需要对历史数据进行再次扫描,有效降低了算法的时间复杂度,适用于在大数据和高速数据流环境下的核函数学习问题,其对无监督学习的支持有效解决了大数据流中部分标记缺失的问题。在MOA生成的人工数据集以及UCI大数据分析的基准数据集上进行算法有效性的评估,其结果表明该算法是有效的。 展开更多
关键词 大数据流 在线多核学习 流形学习 数据依赖核 半监督学习
下载PDF
基于有监督判别投影的网络安全数据降维算法 被引量:15
15
作者 郭方方 吕宏武 +1 位作者 任威霖 王瑞妮 《通信学报》 EI CSCD 北大核心 2021年第6期84-93,共10页
针对传统流形学习在数据降维时不考虑原数据类别和聚类程度低的缺陷,提出了一种有监督判别投影(SDP)的流形学习降维算法来改善网络安全数据降维效果。在近邻矩阵基础上,利用数据集的类别标签信息,构建有监督判别矩阵,变无监督流形学习... 针对传统流形学习在数据降维时不考虑原数据类别和聚类程度低的缺陷,提出了一种有监督判别投影(SDP)的流形学习降维算法来改善网络安全数据降维效果。在近邻矩阵基础上,利用数据集的类别标签信息,构建有监督判别矩阵,变无监督流形学习为有监督学习,寻找一个同时具有最大全局散度矩阵和最小局部散度矩阵的低维投影子空间,保证了降维投影后同类数据聚集而异类数据分散的特性。实验结果显示,与传统降维算法相比,所提算法可以较低的时间复杂度去除冗余数据,并且降维后的数据聚类效果更好,异类样本更分散,适用于实际的网络安全数据分析模型。 展开更多
关键词 数据降维 流形学习 有监督学习 判别投影
下载PDF
基于正则化的半监督等距映射数据降维方法 被引量:5
16
作者 王宪保 陈诗文 姚明海 《电子与信息学报》 EI CSCD 北大核心 2016年第1期241-245,共5页
针对等距映射(ISOMAP)算法无监督,不能生成显式映射函数等局限性,该文提出一种正则化的半监督等距映射(Reg-SS-ISOMAP)算法。该算法首先利用训练样本的标签样本构建K联通图(K-CG),得到近似样本间测地线距离,并作为矢量特征代替原始数据... 针对等距映射(ISOMAP)算法无监督,不能生成显式映射函数等局限性,该文提出一种正则化的半监督等距映射(Reg-SS-ISOMAP)算法。该算法首先利用训练样本的标签样本构建K联通图(K-CG),得到近似样本间测地线距离,并作为矢量特征代替原始数据点;然后通过测地线距离计算核矩阵,用半监督正则化方法代替多维尺度分析(MDS)算法处理矢量特征;最后利用正则化回归模型构建目标函数,得到低维表示的显式映射。算法在多个数据集上进行了比较实验,结果表明,文中提出的算法降维效果稳定,识别率高,显示了算法的有效性。 展开更多
关键词 数据降维 流形学习 半监督学习 正则化
下载PDF
非线性系统规律的动态可视化方法 被引量:2
17
作者 刘晓平 季浩 沈冠町 《系统仿真学报》 CAS CSCD 北大核心 2012年第6期1287-1292,共6页
随着对非线性系统的深入研究,人们发现生活中大量现象内部存在着复杂的非线性作用机制,单纯依靠抽象思维去发现和理解事物背后的规律越来越困难。为了展现非线性系统数据流中的内在规律信息,以相空间重构和流形学习算法为基础,提出一种... 随着对非线性系统的深入研究,人们发现生活中大量现象内部存在着复杂的非线性作用机制,单纯依靠抽象思维去发现和理解事物背后的规律越来越困难。为了展现非线性系统数据流中的内在规律信息,以相空间重构和流形学习算法为基础,提出一种非线性系统规律分析可视化方法。在此基础上,通过改进只能处理静态时序数据的算法,提出针对数据流信息的可视化方法,用于动态展示非线性系统的变化规律。最后通过仿真实验,说明该方法可以有效的可视非线性系统规律信息,辅助人们认知和分析事物发展趋势。 展开更多
关键词 非线性系统 相空间重构 数据流 流形学习 可视化
下载PDF
基于改进SVM的模拟电路故障诊断 被引量:1
18
作者 周绍磊 廖剑 +1 位作者 史贤俊 戴邵武 《海军航空工程学院学报》 2014年第2期117-121,共5页
针对模拟电路的故障诊断和定位问题,提出了一种改进支持向量机(Support Vector Machine,SVM)故障诊断方法。通过在标准SVM中加入了对数据流形局部分布的约束,设计了一种依赖于数据分布的新型SVM。相对于标准SVM方法而言,新方法有效融合... 针对模拟电路的故障诊断和定位问题,提出了一种改进支持向量机(Support Vector Machine,SVM)故障诊断方法。通过在标准SVM中加入了对数据流形局部分布的约束,设计了一种依赖于数据分布的新型SVM。相对于标准SVM方法而言,新方法有效融合了数据分布的先验信息,提高了模型的诊断精度。将其用于模拟电路的故障诊断,验证了所提方法的有效性。 展开更多
关键词 故障诊断 模拟电路 支持向量机 数据流形
下载PDF
化工系统海量数据的扩散映射和异常辨识 被引量:7
19
作者 高智勇 霍伟汉 +1 位作者 高建民 姜洪权 《计算机集成制造系统》 EI CSCD 北大核心 2014年第12期3091-3096,共6页
为充分提取化工系统中的故障特征以辨识故障类型,提出针对动态系统海量数据的故障分类方法。该方法利用扩散映射算法与扩散映射的线性增量算法,对高维空间中的化工系统运行数据进行降维,提取出数据中的低维流形特征。利用降维后的故障... 为充分提取化工系统中的故障特征以辨识故障类型,提出针对动态系统海量数据的故障分类方法。该方法利用扩散映射算法与扩散映射的线性增量算法,对高维空间中的化工系统运行数据进行降维,提取出数据中的低维流形特征。利用降维后的故障样本训练支持向量机多类分类器,实现系统在线数据异常辨识。通过田纳西—伊斯曼仿真数据和实际生产运行数据验证了方法的可行性和高效性。与其他类似分类方法对比,该方法具有更高的分类精度。 展开更多
关键词 化工系统 海量数据 故障分类 流形学习 扩散映射 支持向量机 故障诊断
下载PDF
面向流形数据的共享近邻密度峰值聚类算法 被引量:3
20
作者 赵嘉 马清 +2 位作者 肖人彬 潘正祥 韩龙哲 《智能系统学报》 CSCD 北大核心 2023年第4期719-730,共12页
流形数据由一些弧线状或环状的类簇组成,其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此,本文提出面向流形数据的共享近邻密度峰值聚类(dens... 流形数据由一些弧线状或环状的类簇组成,其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此,本文提出面向流形数据的共享近邻密度峰值聚类(density peaks clustering based on shared nearest neighbor for manifold datasets,DPC-SNN)算法。提出了一种基于共享近邻的样本相似度定义方式,使得同一流形类簇样本间的相似度尽可能高;基于上述相似度定义局部密度,不忽略距类簇中心较远样本的密度贡献,能更好地区分出流形类簇的类簇中心与其他样本;根据样本的相似度分配剩余样本,避免了样本的连续误分配。DPC-SNN算法与DPC、FKNNDPC、FNDPC、DPCSA及IDPC-FA算法的对比实验结果表明,DPC-SNN算法能够有效发现流形数据的类簇中心并准确完成聚类,对真实以及人脸数据集也有不错的聚类效果。 展开更多
关键词 密度峰值 聚类分析 流形数据 K近邻 共享近邻 样本相似度 数据挖掘 图像处理
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部