期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
Density Clustering Algorithm Based on KD-Tree and Voting Rules
1
作者 Hui Du Zhiyuan Hu +1 位作者 Depeng Lu Jingrui Liu 《Computers, Materials & Continua》 SCIE EI 2024年第5期3239-3259,共21页
Traditional clustering algorithms often struggle to produce satisfactory results when dealing with datasets withuneven density. Additionally, they incur substantial computational costs when applied to high-dimensional... Traditional clustering algorithms often struggle to produce satisfactory results when dealing with datasets withuneven density. Additionally, they incur substantial computational costs when applied to high-dimensional datadue to calculating similarity matrices. To alleviate these issues, we employ the KD-Tree to partition the dataset andcompute the K-nearest neighbors (KNN) density for each point, thereby avoiding the computation of similaritymatrices. Moreover, we apply the rules of voting elections, treating each data point as a voter and casting a votefor the point with the highest density among its KNN. By utilizing the vote counts of each point, we develop thestrategy for classifying noise points and potential cluster centers, allowing the algorithm to identify clusters withuneven density and complex shapes. Additionally, we define the concept of “adhesive points” between two clustersto merge adjacent clusters that have similar densities. This process helps us identify the optimal number of clustersautomatically. Experimental results indicate that our algorithm not only improves the efficiency of clustering butalso increases its accuracy. 展开更多
关键词 Density peaks clustering KD-TREE k-nearest neighbors voting rules
下载PDF
Consistency of the k-Nearest Neighbor Classifier for Spatially Dependent Data
2
作者 Ahmad Younso Ziad Kanaya Nour Azhari 《Communications in Mathematics and Statistics》 SCIE CSCD 2023年第3期503-518,共16页
The purpose of this paper is to investigate the k-nearest neighbor classification rule for spatially dependent data.Some spatial mixing conditions are considered,and under such spatial structures,the well known k-neare... The purpose of this paper is to investigate the k-nearest neighbor classification rule for spatially dependent data.Some spatial mixing conditions are considered,and under such spatial structures,the well known k-nearest neighbor rule is suggested to classify spatial data.We established consistency and strong consistency of the classifier under mild assumptions.Our main results extend the consistency result in the i.i.d.case to the spatial case. 展开更多
关键词 Bayes rule Spatial data Training data k-nearest neighbor rule Mixing condition CONSISTENCY
原文传递
一种序列的加权kNN分类方法 被引量:15
3
作者 朱明旱 罗大庸 易励群 《电子学报》 EI CAS CSCD 北大核心 2009年第11期2584-2588,共5页
针对加权kNN(k-Nearest Neighbor)方法在对样本进行分类时,仅仅只利用了它的k近邻点来进行分类决策的不足,提出了一种序列的加权kNN分类方法.该方法在对某个测试样本进行分类时,除了利用它k近邻点所提供的类别信息外,还有效地利用了前... 针对加权kNN(k-Nearest Neighbor)方法在对样本进行分类时,仅仅只利用了它的k近邻点来进行分类决策的不足,提出了一种序列的加权kNN分类方法.该方法在对某个测试样本进行分类时,除了利用它k近邻点所提供的类别信息外,还有效地利用了前面已分类样本的类别信息,这使得测试样本的分类决策更加合理和有效.在Cohn-Kanade人脸库上进行的表情识别实验表明,在序列样本分类的场合,该方法的分类效果比加权kNN方法更好. 展开更多
关键词 加权kNN 流形 贝叶斯规则 序列的加权kNN
下载PDF
缺失数据插补方法探讨——基于最近邻插补法和关联规则法 被引量:21
4
作者 于力超 金勇进 王俊 《统计与信息论坛》 CSSCI 北大核心 2015年第1期35-40,共6页
提出基于最近邻插补和关联规则的缺失数据插补方法,将不含缺失数据的变量作为辅助变量,通过定义距离函数寻找与含缺失数据的样本单元距离较近的样本,然后利用挖掘得到的关联规则支持度和提升度乘积的倒数作为权重,对样本单元之间的距离... 提出基于最近邻插补和关联规则的缺失数据插补方法,将不含缺失数据的变量作为辅助变量,通过定义距离函数寻找与含缺失数据的样本单元距离较近的样本,然后利用挖掘得到的关联规则支持度和提升度乘积的倒数作为权重,对样本单元之间的距离进行加权处理,得到加权距离,再用加权距离最小的样本单元对应的属性值对缺失值进行插补。这种方法可以解决由不同最近距离样本单元得到不同插补值的问题,最后给出了该方法的实施步骤和应用范例。 展开更多
关键词 关联规则 缺失数据 最近邻插补 加权距离
下载PDF
基于最近邻原则的半监督聚类算法 被引量:7
5
作者 计华 张化祥 孙晓燕 《计算机工程与设计》 CSCD 北大核心 2011年第7期2455-2458,共4页
基于最近邻原则的半监督聚类算法是以基于最近邻的聚类中心求解算法为基础的。在基于最近邻的聚类中心求解算法中,用相似度矩阵记录数据点间的相似程度,由目标函数最小值求得聚类的类中心点。在基于最近邻原则的半监督聚类算法中,根据... 基于最近邻原则的半监督聚类算法是以基于最近邻的聚类中心求解算法为基础的。在基于最近邻的聚类中心求解算法中,用相似度矩阵记录数据点间的相似程度,由目标函数最小值求得聚类的类中心点。在基于最近邻原则的半监督聚类算法中,根据约束信息来调整相似度矩阵G,数据点间相似度的变化引起了数据点间加权欧式距离的变化,由此更新加权欧式距离矩阵M,最后执行聚类中心求解算法完成聚类。大量实验结果表明,该算法能获得较好的聚类结果。 展开更多
关键词 最近邻原则 加权欧式距离矩阵 半监督聚类 类中心点 约束信息
下载PDF
基于局部加权重构的化工过程数据恢复算法 被引量:4
6
作者 郭金玉 袁堂明 李元 《计算机应用》 CSCD 北大核心 2016年第1期282-286,共5页
针对化工过程数据中存在缺失数据的问题,在保持局部数据结构特征的基础上提出了基于局部加权重构的化工过程数据恢复算法。通过定位缺失的数据点并以符号Na N(Not a Number)标记,将缺失的数据集分为完备数据集和不完备数据集。不完备的... 针对化工过程数据中存在缺失数据的问题,在保持局部数据结构特征的基础上提出了基于局部加权重构的化工过程数据恢复算法。通过定位缺失的数据点并以符号Na N(Not a Number)标记,将缺失的数据集分为完备数据集和不完备数据集。不完备的数据集按照完整性的大小依次找到它们在完备数据集中相应的k个近邻,根据误差平方和最小的原则,求出k个近邻相应的权值,用k个近邻及相应的权值重构出缺失的数据点。将该算法应用在不同缺失率下的两种化工过程数据中并与望最大化主成分分析(EM-PCA)法和平均值(MA)两种传统的数据恢复算法相比较,该算法的恢复数据误差最小,并且计算速度相比EM-PCA算法平均提高了2倍。实验结果表明,局部加权重构的化工过程数据恢复算法可以有效地对数据进行恢复,提高了数据的利用率,适用于非线性化工过程缺失数据的恢复。 展开更多
关键词 数据挖掘 缺失数据 数据恢复 k近邻规则 局部加权重构 化工过程
下载PDF
基于局部权重k-近质心近邻算法 被引量:2
7
作者 谢红 赵洪野 解武 《应用科技》 CAS 2015年第5期10-13,共4页
k-近质心近邻原则是k-近邻原则的一种有效扩展,是有效的模式分类方法之一。k-近质心近邻原则容易受到局外点的影响;同时,所有的k-近质心近邻点在分类决策时具有相同的权重和分类贡献率,这显然是不合理的。为了解决这一问题,考虑到质心... k-近质心近邻原则是k-近邻原则的一种有效扩展,是有效的模式分类方法之一。k-近质心近邻原则容易受到局外点的影响;同时,所有的k-近质心近邻点在分类决策时具有相同的权重和分类贡献率,这显然是不合理的。为了解决这一问题,考虑到质心近邻在模式分类问题上具有近邻特性和空间分布特性,提出一种基于局部权重的近质心近邻算法,实验结果表明该LWKNCN算法在分类精度上优于传统的KNN算法和KNCN算法。 展开更多
关键词 模式分类 近邻原则 K-近邻 k-近质心近邻 局部权重
下载PDF
基于组合神经网络的红外场景仿真
8
作者 黄超超 吴晓迪 《弹箭与制导学报》 CSCD 北大核心 2006年第4期272-275,共4页
目标和背景的红外特性仿真在国防军事上具有重大的意义。文中对车辆、水泥路面、草地、树木和灌木等物体组成的场景的红外特性进行了多次测量,得到了场景的红外特性的训练样本集合,然后运用基于总体平均的组合神经网络,根据最邻近规则... 目标和背景的红外特性仿真在国防军事上具有重大的意义。文中对车辆、水泥路面、草地、树木和灌木等物体组成的场景的红外特性进行了多次测量,得到了场景的红外特性的训练样本集合,然后运用基于总体平均的组合神经网络,根据最邻近规则采用加权平均法组合各个神经网络的输出结果,最终绘制出场景在不同设定条件下的红外图像。 展开更多
关键词 红外仿真 组合神经网络 最邻近规则 加权平均
下载PDF
基于局部保持投影–加权k近邻规则的多模态间歇过程故障检测策略 被引量:11
9
作者 张成 郭青秀 +1 位作者 冯立伟 李元 《控制理论与应用》 EI CAS CSCD 北大核心 2019年第10期1682-1689,共8页
针对多模态间歇过程故障检测问题,本文提出一种基于局部保持投影–加权k近邻规则(LPP--Wk NN)的故障检测策略.首先,应用局部保持投影(LPP)方法将原始数据投影到低维主元子空间;接下来,在主元子空间中,应用样本第k近邻的局部近邻集确定... 针对多模态间歇过程故障检测问题,本文提出一种基于局部保持投影–加权k近邻规则(LPP--Wk NN)的故障检测策略.首先,应用局部保持投影(LPP)方法将原始数据投影到低维主元子空间;接下来,在主元子空间中,应用样本第k近邻的局部近邻集确定每个样本的权重并计算权重统计量Dw;最后,应用核密度估计方法确定Dw控制限并进行故障检测.本文方法应用LPP对过程数据进行维数约减,既能够降低训练过程中离群点对模型的影响,又能够降低在线故障检测的计算复杂度.同时,加权k近邻规则(Wk NN)方法通过引入权重规则能够使得过程故障检测统计量分布具有单模态结构.相比传统的k NN统计量,本文引入的权重统计量具有更高的故障检测性能.通过数值例子和半导体蚀刻过程的仿真实验,并与主元分析(PCA), k NN, Wk NN, LPP--k NN等方法进行比较,实验结果验证了本文方法的有效性. 展开更多
关键词 局部保持投影 权重k近邻规则 间歇过程 故障检测
下载PDF
k-NN METHOD IN PARTIAL LINEAR MODEL UNDER RANDOM CENSORSHIP 被引量:1
10
作者 QIN GENGSHENG (Department of Mathematics,Sichuan University, Chengdu 610064). 《Applied Mathematics(A Journal of Chinese Universities)》 SCIE CSCD 1995年第3期275-286,共12页
Consider the regression model Y=Xβ+ g(T) + e. Here g is an unknown smoothing function on [0, 1], β is a l-dimensional parameter to be estimated, and e is an unobserved error. When data are randomly censored, the est... Consider the regression model Y=Xβ+ g(T) + e. Here g is an unknown smoothing function on [0, 1], β is a l-dimensional parameter to be estimated, and e is an unobserved error. When data are randomly censored, the estimators βn* and gn*forβ and g are obtained by using class K and the least square methods. It is shown that βn* is asymptotically normal and gn* achieves the convergent rate O(n-1/3). 展开更多
关键词 Partial linear model censored data class K method k-nearest neighbor weights
下载PDF
A Comparison of Selected Parametric and Non-Parametric Imputation Methods for Estimating Forest Biomass and Basal Area 被引量:1
11
作者 Donald Gagliasso Susan Hummel Hailemariam Temesgen 《Open Journal of Forestry》 2014年第1期42-48,共7页
Various methods have been used to estimate the amount of above ground forest biomass across landscapes and to create biomass maps for specific stands or pixels across ownership or project areas. Without an accurate es... Various methods have been used to estimate the amount of above ground forest biomass across landscapes and to create biomass maps for specific stands or pixels across ownership or project areas. Without an accurate estimation method, land managers might end up with incorrect biomass estimate maps, which could lead them to make poorer decisions in their future management plans. The goal of this study was to compare various imputation methods to predict forest biomass and basal area, at a project planning scale (a combination of ground inventory plots, light detection and ranging (LiDAR) data, satellite imagery, and climate data was analyzed, and their root mean square error (RMSE) and bias were calculated. Results indicate that for biomass prediction, the k-nn (k = 5) had the lowest RMSE and least amount of bias. The second most accurate method consisted of the k-nn (k = 3), followed by the GWR model, and the random forest imputation. For basal area prediction, the GWR model had the lowest RMSE and least amount of bias. The second most accurate method was k-nn (k = 5), followed by k-nn (k = 3), and the random forest method. For both metrics, the GNN method was the least accurate based on the ranking of RMSE and bias. 展开更多
关键词 Gradient Nearest neighbor MOST Similar neighbor k-nearest neighbor Random FOREST GEOGRAPHIC weighted Regression Biomass LiDAR
下载PDF
Strong Uniform Consistency of k-Nearest Neighbor Regression Function Estimators
12
作者 秦更生 成平 《Science China Mathematics》 SCIE 1994年第9期1032-1040,共9页
<正> For a wide class of nonparametric regression functions, the nearest neighbor estimator is constructed, and the uniform measure of deviation from the estimator to the regression function is studied. Under so... <正> For a wide class of nonparametric regression functions, the nearest neighbor estimator is constructed, and the uniform measure of deviation from the estimator to the regression function is studied. Under some mild conditions, it is shown that the estimators are uniformly strongly consistent for both randomly complete data and censored data. 展开更多
关键词 STRONG UNIFORM CONSISTENCY k-nearest neighbor weightS class K method censored data.
原文传递
Discharge estimation based on machine learning
13
作者 Zhu JIANG Hui-yan WANG Wen-wu SONG 《Water Science and Engineering》 EI CAS CSCD 2013年第2期145-152,共8页
To overcome the limitations of the traditional stage-discharge models in describing the dynamic characteristics of a river, a machine learning method of non-parametric regression, the locally weighted regression metho... To overcome the limitations of the traditional stage-discharge models in describing the dynamic characteristics of a river, a machine learning method of non-parametric regression, the locally weighted regression method was used to estimate discharge. With the purpose of improving the precision and efficiency of river discharge estimation, a novel machine learning method is proposed: the clustering-tree weighted regression method. First, the training instances are clustered. Second, the k-nearest neighbor method is used to cluster new stage samples into the best-fit cluster. Finally, the daily discharge is estimated. In the estimation process, the interference of irrelevant information can be avoided, so that the precision and efficiency of daily discharge estimation are improved. Observed data from the Luding Hydrological Station were used for testing. The simulation results demonstrate that the precision of this method is high. This provides a new effective method for discharge estimation. 展开更多
关键词 stage-discharge relationship discharge estimation locally weighted regression clustering-tree weighted regression k-nearest neighbor method
下载PDF
邻域保持嵌入—加权k近邻故障检测算法及其在半导体蚀刻过程中的应用
14
作者 张成 郑晓芳 +3 位作者 郭青秀 冯立伟 戴絮年 李元 《信息与控制》 CSCD 北大核心 2019年第6期738-744,共7页
为了解决复杂的多模态过程故障检测问题,提出了邻域保持嵌入—加权k近邻规则(neighborhood preserving embedding-weighted k-nearest neighbors,NPE-wkNN)质量监控方法.首先,利用邻域保持嵌入(neighborhood preserving embedding,NPE)... 为了解决复杂的多模态过程故障检测问题,提出了邻域保持嵌入—加权k近邻规则(neighborhood preserving embedding-weighted k-nearest neighbors,NPE-wkNN)质量监控方法.首先,利用邻域保持嵌入(neighborhood preserving embedding,NPE)得到特征空间中数据的流形结构;然后,在特征空间中确定每个样本第k近邻的前K近邻集并计算样本的权重.最后,将样本的加权距离作为统计量对过程进行质量监控.NPE-wkNN方法在保持原始数据近邻结构的同时降低了计算复杂度,除此之外,权重规则消除了数据的多模态特征,从而提高了过程故障检测率.通过数值实例和半导体蚀刻工艺仿真实验,对比了传统的主元分析(principal component analysis,PCA)、NPE、k近邻(k-nearest neighbor,kNN)、加权k近邻(weighted kNN,wkNN)等方法,结果验证了本文方法的有效性. 展开更多
关键词 邻域保持嵌入 加权k近邻规则 故障检测 半导体蚀刻过程
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部