期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于朴素贝叶斯的属性混合大数据分类提取
1
作者 吴京朋 刘伟 《计算机仿真》 2024年第2期517-521,共5页
与一般数据类型不同,属性混合大数据在分类提取过程中易受边缘数据的干扰,存在分类提取误差较大和抗噪能力不佳的问题,于是提出基于朴素贝叶斯算法的属性混合大数据分类提取方法。采用离散小波变换法消除大数据中存在的噪声,避免分类提... 与一般数据类型不同,属性混合大数据在分类提取过程中易受边缘数据的干扰,存在分类提取误差较大和抗噪能力不佳的问题,于是提出基于朴素贝叶斯算法的属性混合大数据分类提取方法。采用离散小波变换法消除大数据中存在的噪声,避免分类提取过程受到噪声干扰。通过监督判别投影法对大数据实行降维处理,将预处理后的属性混合大数据输入到朴素贝叶斯分类器中,通过先验知识与后验概率的结合,完成属性混合大数据的分类提取。实验结果表明,所提方法的运算耗时短、分类提取误差小、抗噪声能力强,验证了所提方法的应用效果。 展开更多
关键词 离散小波变换 监督判别投影 局部近邻图 先验知识 后验概率
下载PDF
基于改进局部密度的可扩展层次聚类算法
2
作者 陈斌 谢文波 +2 位作者 付勋 张恒基 王欣 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期370-382,共13页
层次聚类是无监督学习的重点研究方向,由于其结果易于分析,因此被广泛应用于数据挖掘领域.目前大多数层次聚类算法都需要根据数据的成对距离进行簇合并操作,因此具有较高的复杂度(不论是时间或空间),无法用于大规模数据的处理.针对以上... 层次聚类是无监督学习的重点研究方向,由于其结果易于分析,因此被广泛应用于数据挖掘领域.目前大多数层次聚类算法都需要根据数据的成对距离进行簇合并操作,因此具有较高的复杂度(不论是时间或空间),无法用于大规模数据的处理.针对以上问题,提出了一种基于改进局部密度的可扩展层次聚类算法(Density-based Scalable Hierarchical Clustering,DBSC).该算法根据数据间的最近邻关系构造最近邻图,并在每个最近邻分量上根据互惠最近邻结点的局部密度选择代表点.为了降低孤立最近邻分量对计算局部密度的干扰,算法利用二阶最近邻将孤立最近邻分量重连至最近邻分量.通过以上步骤算法选择代表点,以迭代的方式自下而上地构建聚类树.大量真实数据集的实验结果表明,该算法可以在保证较高的聚类精度和较快的响应速度的前提下将处理数据的规模提升至数十万项. 展开更多
关键词 层次聚类 局部密度 最近邻图 互惠最近邻
下载PDF
基于k-近邻局部线性邻域重建的多视角聚类算法
3
作者 马盈仓 吴也凡 +1 位作者 邢志伟 袁林 《纺织高校基础科学学报》 CAS 2023年第3期75-83,共9页
多视图聚类旨在利用不同视图间互为差异、互相补充的信息对数据对象进行聚类,如何融合不同视角的数据是多视角聚类算法的重要问题之一。为了能更准确有效地刻画视角间的相似关系,提出一种基于k-近邻局部线性邻域重建的多视角聚类算法。... 多视图聚类旨在利用不同视图间互为差异、互相补充的信息对数据对象进行聚类,如何融合不同视角的数据是多视角聚类算法的重要问题之一。为了能更准确有效地刻画视角间的相似关系,提出一种基于k-近邻局部线性邻域重建的多视角聚类算法。首先,利用数据点间的距离分配概率近邻,得到各视角数据对应的相似矩阵;其次,通过引入k-近邻,对各视角相似矩阵进行局部线性邻域重建后融合为统一的相似矩阵;同时,引入HSIC刻画不同视角的多样性。通过将统一图的学习与多样性学习整合在统一的框架中,本模型有能力输出一个包含了各视图多样信息的融合图。通过交替迭代算法,所提模型可以被很好地优化。多个公开数据集上的对比实验证明了所提出算法的有效性优于其他已有算法。 展开更多
关键词 多视角聚类 图学习 K-近邻 局部线性 希尔伯特-施密特独立准则
下载PDF
有监督的无参数核局部保持投影及人脸识别 被引量:3
4
作者 龚劬 许凯强 《计算机科学》 CSCD 北大核心 2016年第9期301-304,309,共5页
针对发掘人脸图像中的高维非线性结构,将加核及构造无参数近邻图两种思想同时引入到局部保持投影算法中,在有监督的模式下,提出了一种新的有监督的无参数核局部保持投影(Parameter-less Supervised Kernel Locality Preserving Projecti... 针对发掘人脸图像中的高维非线性结构,将加核及构造无参数近邻图两种思想同时引入到局部保持投影算法中,在有监督的模式下,提出了一种新的有监督的无参数核局部保持投影(Parameter-less Supervised Kernel Locality Preserving Projection,PSKLPP)算法并给出了其推导过程。该算法通过将欧氏距离改为对离群数据更为鲁棒的余弦距离,构造无参数近邻图,利用核方法提取人脸图像中的非线性信息,并将其投影在一个高维非线性空间,运用局部保持投影算法得到一线性映射,有效避免了在计算相似矩阵过程中面临的复杂参数选择问题。在ORL和Yale人脸库上的仿真实验验证了所提算法的有效性。 展开更多
关键词 人脸识别 特征提取 局部保持投影 无参数近邻图 核方法
下载PDF
基于局部密度和测地距离的谱聚类
5
作者 张涛 葛洪伟 +1 位作者 苏辉 张欢庆 《计算机工程与应用》 CSCD 北大核心 2017年第7期141-146,262,共7页
传统根据K-近邻图计算测地距离的方法,虽然能够发现流形分布数据间的相似关系,但是当不同类的点存在粘连关系时,依此计算相似度时不能体现样本间的真实关系,从而无法有效聚类。针对传统测地距离计算相似度的方法不能有效处理粘连数据集... 传统根据K-近邻图计算测地距离的方法,虽然能够发现流形分布数据间的相似关系,但是当不同类的点存在粘连关系时,依此计算相似度时不能体现样本间的真实关系,从而无法有效聚类。针对传统测地距离计算相似度的方法不能有效处理粘连数据集的问题,提出了基于局部密度和测地距离的谱聚类方法。计算样本的局部密度,寻找每个样本点的最近高密度点,并选择边缘点和非边缘点;在边缘点和其最近高密度点之间构造边、非边缘点之间的K个近邻点构造边,依此计算测地距离和相似度并进行聚类。在人工数据集和UCI数据集上的实验表明,该算法在处理粘连数据集时有效提高了聚类准确率。 展开更多
关键词 K-近邻图 测地距离 局部密度 相似度 谱聚类
下载PDF
基于中心域的LPP算法研究
6
作者 张建明 刘俊宁 杜丹 《计算机工程与设计》 CSCD 北大核心 2011年第9期3128-3130,3139,共4页
针对LPP算法中最近相邻图不能很好地表示流形的局部结构问题,提出一种基于中心域的保局投影算法。该算法采用LBP获取图像的高阶全局统计信息,并将其投影到LPP的流形空间。流形空间的获取是以各图像间的中心域的欧式距离为标准构建最近... 针对LPP算法中最近相邻图不能很好地表示流形的局部结构问题,提出一种基于中心域的保局投影算法。该算法采用LBP获取图像的高阶全局统计信息,并将其投影到LPP的流形空间。流形空间的获取是以各图像间的中心域的欧式距离为标准构建最近相邻图,使其可以简单地、较好地表示流形局部结构,并得到数量较少的特征维数。在ORL人脸库上的实验结果表明,该方法可有效地降低特征维数,并取得较好的识别率。 展开更多
关键词 最近相邻图 中心域 局部二值模式 保局投影 流形空间
下载PDF
基于改进的自适应局部保持投影算法的人脸识别 被引量:4
7
作者 梅玲玲 龚劬 《计算机科学》 CSCD 北大核心 2016年第8期286-291,共6页
局部保持投影(LPP)通过构造近邻图来保持样本的局部结构,在构造近邻图的过程中,LPP会遇到两个参数K和σ的选择问题。近邻图的构建对算法的识别效果起着重要的作用,因而这两个参数的选择会在很大程度上影响LPP的识别率。为了避免参数的... 局部保持投影(LPP)通过构造近邻图来保持样本的局部结构,在构造近邻图的过程中,LPP会遇到两个参数K和σ的选择问题。近邻图的构建对算法的识别效果起着重要的作用,因而这两个参数的选择会在很大程度上影响LPP的识别率。为了避免参数的选择对识别率造成影响,提出了一种基于改进的自适应局部保持投影的人脸识别算法。首先,构造无参数的近邻图,其能够自适应地选取样本的近邻点并确定其相应的边权。其次,由于在计算过程中出现了矩阵维数过高的问题,因此采用QR分解进行降维处理。最后,利用共轭正交化使得投影轴具有统计不相关性,以降低特征矢量间的统计相关性,提高识别率。在ORL人脸库和YALE人脸库上进行了实验,结果表明改进的算法在识别率方面整体上好于LPP算法、DLPP算法、LMMC算法。 展开更多
关键词 近邻图 自适应局部保持投影 人脸识别 共轭正交 统计不相关 降维
下载PDF
基于自然邻居邻域图的无参数离群检测算法 被引量:6
8
作者 冯骥 冉瑞生 魏延 《智能系统学报》 CSCD 北大核心 2019年第5期998-1006,共9页
数据挖掘领域,基于最近邻居思想的离群检测算法在面对复杂数据时,很难在没有足够先验知识条件下进行适当的参数选择。为了解决这个问题,本文在自然邻居方法的基础上,提出一种利用加权自然邻居邻域图进行离群检测的算法。该算法在整个过... 数据挖掘领域,基于最近邻居思想的离群检测算法在面对复杂数据时,很难在没有足够先验知识条件下进行适当的参数选择。为了解决这个问题,本文在自然邻居方法的基础上,提出一种利用加权自然邻居邻域图进行离群检测的算法。该算法在整个过程不需要人为设置参数,并且能在不同分布特征的数据中准确找到数据集中的全局离群点和局部离群点。人工数据集和真实数据的离群检测结果均证明,本算法能够取得和有参数的算法中最优参数相近的效果,算法检测结果远好于对参数敏感算法的大部分情况,且更优于对参数不敏感的算法,具有更强的普适性和实用性。 展开更多
关键词 无参数 自适应 最近邻居 加权图 离群检测 离群因子 全局离群点 局部离群点
下载PDF
局部PCA与k近邻相结合的谱聚类算法 被引量:8
9
作者 吴林 文国秋 +2 位作者 童涛 谭马龙 杜婷婷 《计算机工程与设计》 北大核心 2019年第8期2204-2210,共7页
为解决传统谱聚类方法构造相似矩阵时使用距离度量无法充分反映复杂样本空间的全局一致性,且存在聚类个数需要人为指定等问题,提出一种基于近邻与局部PCA结合的谱聚类算法。使用kNN获取邻域子集,使用局部主成分分析保持样本的局部结构,... 为解决传统谱聚类方法构造相似矩阵时使用距离度量无法充分反映复杂样本空间的全局一致性,且存在聚类个数需要人为指定等问题,提出一种基于近邻与局部PCA结合的谱聚类算法。使用kNN获取邻域子集,使用局部主成分分析保持样本的局部结构,同时考虑样本的全局和局部信息,为相似矩阵提供综合信息,对得到的相似矩阵进行图分割,直接得到聚类的结果。在真实数据集上的实验结果表明,该算法能够自动得到类的个数且聚类准确率有所提高,其在非真实类时有更好的聚类效果。 展开更多
关键词 谱聚类 K-近邻 局部主成分分析 相似矩阵 连通图划分
下载PDF
Nearest-neighbor classifier motivated marginal discriminant projections for face recognition 被引量:4
10
作者 Pu HUANG Zhenmin TANG +1 位作者 Caikou CHEN Xintian CHENG 《Frontiers of Computer Science》 SCIE EI CSCD 2011年第4期419-428,共10页
Marginal Fisher analysis (MFA) is a repre- sentative margin-based learning algorithm for face recognition. A major problem in MFA is how to select appropriate parameters, k1 and k2, to construct the respective intri... Marginal Fisher analysis (MFA) is a repre- sentative margin-based learning algorithm for face recognition. A major problem in MFA is how to select appropriate parameters, k1 and k2, to construct the respective intrinsic and penalty graphs. In this paper, we propose a novel method called nearest-neighbor (NN) classifier motivated marginal discriminant projections (NN-MDP). Motivated by the NN classifier, NN-MDP seeks a few projection vectors to prevent data samples from being wrongly categorized. Like MFA, NN-MDP can characterize the compactness and separability of samples simultaneously. Moreover, in contrast to MFA, NN-MDP can actively construct the intrinsic graph and penalty graph without unknown parameters. Experimental results on the 0RL, Yale, and FERET face databases show that NN-MDP not only avoids the intractability, and high expense of neighborhood parameter selection, but is also more applicable to face recognition with NN classifier than other methods. 展开更多
关键词 dimensionality reduction (DR) face recogni-tion marginal Fisher analysis (MFA) locality preservingprojections (LPP) graph construction margin-based nearest-neighbor (NN) classifier
原文传递
一种基于动态局部密度和聚类结构的聚类算法 被引量:2
11
作者 卢建云 张蔚 李林 《山东大学学报(工学版)》 CAS CSCD 北大核心 2022年第2期118-127,共10页
为提高逆k最近邻在度量局部密度时的区分度,提出动态逆k最近邻概念。利用泊松概率密度函数拟合逆k最近邻分布,并计算累积动态逆k最近邻局部密度;基于动态局部密度对数据对象进行排序,利用逆k最近邻域扩展算法生成聚类结构;依据动态局部... 为提高逆k最近邻在度量局部密度时的区分度,提出动态逆k最近邻概念。利用泊松概率密度函数拟合逆k最近邻分布,并计算累积动态逆k最近邻局部密度;基于动态局部密度对数据对象进行排序,利用逆k最近邻域扩展算法生成聚类结构;依据动态局部密度和欧式距离设计聚类决策图,根据决策图找出聚类结构中的类间间断点,利用间断点将聚类结构直接划分成独立的类簇。将本研究提出的聚类结构划分聚类(cluster structure partition clustering, CSPC)算法与DBSCAN、DPC和RNN-DBSCAN算法在人工和真实数据集上进行试验对比,CSCP在人工和真实数据集上的评价指标F1平均分别提高8.8%和8.2%,评价指标标准互信息平均分别提高11.6%和7.3%。试验结果表明CSPC算法取得了更好的聚类结果。 展开更多
关键词 动态局部密度 泊松概率密度函数 逆k最近邻 聚类结构 决策图
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部