期刊文献+
共找到631篇文章
< 1 2 32 >
每页显示 20 50 100
Pruned fuzzy K-nearest neighbor classifier for beat classification 被引量:2
1
作者 Muhammad Arif Muhammad Usman Akram Fayyaz-ul-Afsar Amir Minhas 《Journal of Biomedical Science and Engineering》 2010年第4期380-389,共10页
Arrhythmia beat classification is an active area of research in ECG based clinical decision support systems. In this paper, Pruned Fuzzy K-nearest neighbor (PFKNN) classifier is proposed to classify six types of beats... Arrhythmia beat classification is an active area of research in ECG based clinical decision support systems. In this paper, Pruned Fuzzy K-nearest neighbor (PFKNN) classifier is proposed to classify six types of beats present in the MIT-BIH Arrhythmia database. We have tested our classifier on ~ 103100 beats for six beat types present in the database. Fuzzy KNN (FKNN) can be implemented very easily but large number of training examples used for classification can be very time consuming and requires large storage space. Hence, we have proposed a time efficient Arif-Fayyaz pruning algorithm especially suitable for FKNN which can maintain good classification accuracy with appropriate retained ratio of training data. By using Arif-Fayyaz pruning algorithm with Fuzzy KNN, we have achieved a beat classification accuracy of 97% and geometric mean of sensitivity of 94.5% with only 19% of the total training examples. The accuracy and sensitivity is comparable to FKNN when all the training data is used. Principal Component Analysis is used to further reduce the dimension of feature space from eleven to six without compromising the accuracy and sensitivity. PFKNN was found to robust against noise present in the ECG data. 展开更多
关键词 ARRHYTHMIA ECG k-nearest neighbor PRUNING FUZZY classification
下载PDF
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 被引量:1
2
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《Journal of Data Analysis and Information Processing》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 classification Algorithms NON-PARAMETRIC k-nearest-neighbor Neural Networks Random Forest Support Vector Machines
下载PDF
基于密文KNN检索的室内定位隐私保护算法
3
作者 欧锦添 乐燕芬 施伟斌 《数据采集与处理》 CSCD 北大核心 2024年第2期456-470,共15页
在定位请求服务中,如何保护用户的位置隐私和位置服务提供商(Localization service provider,LSP)的数据隐私是关系到WiFi指纹定位应用的一个具有挑战性的问题。基于密文域的K-近邻(K-nearest neighbors,KNN)检索,本文提出了一种适用于... 在定位请求服务中,如何保护用户的位置隐私和位置服务提供商(Localization service provider,LSP)的数据隐私是关系到WiFi指纹定位应用的一个具有挑战性的问题。基于密文域的K-近邻(K-nearest neighbors,KNN)检索,本文提出了一种适用于三方的定位隐私保护算法,能有效提升对LSP指纹信息隐私的保护强度并降低计算开销。服务器和用户分别完成对指纹信息和定位请求的加密,而第三方则基于加密指纹库和加密定位请求,在隐私状态下完成对用户的位置估计。所提算法把各参考点的位置信息随机嵌入指纹,可避免恶意用户获取各参考点的具体位置;进一步利用布隆滤波器在隐藏接入点信息的情况下,第三方可完成参考点的在线匹配,实现对用户隐私状态下的粗定位,可与定位算法结合降低计算开销。在公共数据集和实验室数据集中,对两种算法的安全、开销和定位性能进行了全面的评估。与同类加密算法比较,在不降低定位精度的情况下,进一步增强了对数据隐私的保护。 展开更多
关键词 隐私保护 指纹定位 密文k-近邻检索 布隆滤波器 WIFI
下载PDF
坝肩岩体质量LDA-KNN分类模型
4
作者 荀鹏 李娟 +2 位作者 魏玉峰 李常虎 范文东 《成都理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期281-290,302,共11页
工程岩体质量分级评价对工程的安全、设计、经济效益等有重要影响。针对当前岩级划分方法中存在不确定性,人为因素干扰和忽视了传统定性分级中对岩体质量评价的重要性等问题,本文通过在工程实际中搜集样本建立数据库,从工程的实际需求出... 工程岩体质量分级评价对工程的安全、设计、经济效益等有重要影响。针对当前岩级划分方法中存在不确定性,人为因素干扰和忽视了传统定性分级中对岩体质量评价的重要性等问题,本文通过在工程实际中搜集样本建立数据库,从工程的实际需求出发,选择岩体完整性系数(K v)、结构面间距(D)、岩石质量指标(RQD)等合适的评价指标,通过引入LDA(Linear Discriminant Analysis)降维方法和K近邻分析(K-Nearest-Neighbor,KNN)相结合的多分类模型,实现了岩体的非线性分级预测。通过定性定量相结合实现了岩体多因素,多指标的综合分级,并解决了多指标判断时信息冗余,复杂程度高的问题。与其他判别方案相比较,模型得出的结果准确率高,符合工程实际,减少了人为因素的影响,体现出较强的预测判别能力。该研究为水电站大坝坝肩处的平硐岩体质量划分提出了一种可行的预测方案。 展开更多
关键词 岩体结构 岩体质量分级 线性降维 k近邻算法 分类模型
下载PDF
激光点云线性KNN算法FPGA实现及加速
5
作者 陈小宇 阳梦雪 +1 位作者 李常对 赵鹏程 《应用科学学报》 CAS CSCD 北大核心 2023年第5期831-839,共9页
针对三维激光点云线性K最近邻(K-nearest neighbor, KNN)搜索耗时长的问题,提出了一种利用多处理器片上系统(multi-processor system on chip, MPSoC)现场可编程门阵列(field-programmable gate array,FPGA)实现三维激光点云KNN快速搜... 针对三维激光点云线性K最近邻(K-nearest neighbor, KNN)搜索耗时长的问题,提出了一种利用多处理器片上系统(multi-processor system on chip, MPSoC)现场可编程门阵列(field-programmable gate array,FPGA)实现三维激光点云KNN快速搜索的方法。首先给出了三维激光点云KNN算法的MPSoC FPGA实现框架;然后详细阐述了每个模块的设计思路及实现过程;最后利用MZU15A开发板和天眸16线旋转机械激光雷达搭建了测试平台,完成了三维激光点云KNN算法MPSoC FPGA加速的测试验证。实验结果表明:基于MPSoC FPGA实现的三维激光点云KNN算法能在保证邻近点搜索精度的情况下,减少邻近点搜索耗时。 展开更多
关键词 三维激光点云匹配 k最近邻算法 现场可编程门阵列加速 并行计算
下载PDF
融入KNN算法的二维数组教学案例设计
6
作者 张红霞 高荣 +1 位作者 徐辉 柯琦 《计算机时代》 2023年第6期142-144,148,共4页
为了让计算机专业学生在专业基础课中尽早接触人工智能中的一些概念和算法,激发学生的学习兴趣,设计了一个融入K-近邻算法(K-Nearest Neighbor,KNN)的二维数组教学案例,并对案例教学实施过程、实践任务分解、案例运用效果等方面进行了... 为了让计算机专业学生在专业基础课中尽早接触人工智能中的一些概念和算法,激发学生的学习兴趣,设计了一个融入K-近邻算法(K-Nearest Neighbor,KNN)的二维数组教学案例,并对案例教学实施过程、实践任务分解、案例运用效果等方面进行了阐述。实践结果表明,使用该案例进行教学有利于提高课程教学质量。 展开更多
关键词 二维数组 knn 教学案例 人工智能
下载PDF
面向申威架构的KNN并行算法实现与优化 被引量:2
7
作者 王其涵 庞建民 +3 位作者 岳峰 祝迪 沈莉 肖谦 《计算机工程》 CAS CSCD 北大核心 2023年第5期286-294,共9页
K近邻(KNN)是人工智能中最常用的分类算法,其性能提升对于海量数据的整理分析、大数据分类等任务具有重要意义。目前新一代神威超级计算机正处于应用发展的初始阶段,结合新一代申威异构众核处理器的结构特性,充分利用庞大的计算资源实... K近邻(KNN)是人工智能中最常用的分类算法,其性能提升对于海量数据的整理分析、大数据分类等任务具有重要意义。目前新一代神威超级计算机正处于应用发展的初始阶段,结合新一代申威异构众核处理器的结构特性,充分利用庞大的计算资源实现高效的KNN算法是海量数据分析整理的现实需求。根据SW26010pro处理器的结构特性,采用主从加速编程模型实现一种基础版本的KNN并行算法,其将计算核心传输到从核上,实现了线程级并行。分析影响基础并行算法性能的关键因素并提出优化算法SWKNN,不同于基础并行KNN算法的任务划分方式,SWKNN采用任务重划分策略,以避免冗余计算开销。通过数据流水优化、从核间通信优化、二次负载均衡优化等步骤减少不必要的通信开销,从而有效缓解访存压力并进一步提升算法性能。实验结果表明,与串行KNN算法相比,面向申威架构的基础并行KNN算法在SW26010pro处理器的单核组上可以获得最高48倍的加速效果,在同等数据规模下,SWKNN算法较基础并行KNN算法又可以获得最高399倍的加速效果。 展开更多
关键词 异构众核处理器 k近邻算法 并行计算 算法优化 分类性能
下载PDF
基于重构误差和多块建模策略的kNN故障监测 被引量:3
8
作者 郑静 熊伟丽 吴晓东 《系统仿真学报》 CAS CSCD 北大核心 2023年第1期95-109,共15页
针对基于k近邻(k-nearest neighbor,kNN)的故障监测算法中,引发故障的异常信息易被正常信息淹没,导致故障检测不及时和报警率低的问题,利用自编码器和多块建模策略提出一种基于重构误差的k NN故障监测方法。该方法利用正常工况数据集训... 针对基于k近邻(k-nearest neighbor,kNN)的故障监测算法中,引发故障的异常信息易被正常信息淹没,导致故障检测不及时和报警率低的问题,利用自编码器和多块建模策略提出一种基于重构误差的k NN故障监测方法。该方法利用正常工况数据集训练自编码器模型,基于该模型进行重构误差提取以解决异常信息易被淹没的问题。进一步考虑微小偏移和振荡等故障特征,采用多块建模策略,对各子块分别计算统计量并融合检测。通过一个数值例子与田纳西-伊斯曼(Tennessee-Eastman,TE)过程进行仿真与分析,结果验证了所提方法的有效性与监测性能的提升。 展开更多
关键词 k近邻 重构误差 故障监测 信息提取 多块建模
下载PDF
基于KNN算法与φ-OTDR系统的高铁声屏障故障识别方法 被引量:1
9
作者 付达靓 姚媛媛 +6 位作者 刘华如 高乾熠 李英 张旭苹 戴程程 邹宁睦 张益昕 《光电子技术》 CAS 2023年第3期261-268,共8页
提出了一种基于K近邻(K-nearest neighbors,KNN)算法和相位敏感光时域反射(Phase-sensitive optical time domain reflectometry,φ-OTDR)系统的高铁声屏障故障识别方法。设计了V字型光缆敷设方式,能够感知声屏障不同高度吸声板在脉动... 提出了一种基于K近邻(K-nearest neighbors,KNN)算法和相位敏感光时域反射(Phase-sensitive optical time domain reflectometry,φ-OTDR)系统的高铁声屏障故障识别方法。设计了V字型光缆敷设方式,能够感知声屏障不同高度吸声板在脉动力冲击下的振动,并利用φ-OTDR系统采集振动信号。对振动信号进行多域特征提取以及K近邻分类后,可以实现对声屏障故障状态识别。实验结果表明,在复杂场景下对于故障点的识别正确率达到了90.9%。该方法为声屏障故障识别提供了一条可行的技术路线,能够减少对专业人员的依赖,对于提升高铁声屏障智能运维水平具有重要意义。 展开更多
关键词 相位敏感光时域反射 声屏障 多域特征提取 k近邻
下载PDF
基于CFS-KNN的双能X射线废金属特征优选与分类
10
作者 陈煜昊 叶文华 +1 位作者 徐祥 符杰 《有色金属工程》 CAS 北大核心 2023年第1期86-92,共7页
在基于双能X射线透射技术的废金属分选中,识别效果很大程度上受所选物料特征影响。已有废金属物料识别算法所用特征不够全面且各特征数据间冗余性较大,识别准确度不高。针对该问题,充分考虑特征间冗余性和特征与类别间关联性提出相关性... 在基于双能X射线透射技术的废金属分选中,识别效果很大程度上受所选物料特征影响。已有废金属物料识别算法所用特征不够全面且各特征数据间冗余性较大,识别准确度不高。针对该问题,充分考虑特征间冗余性和特征与类别间关联性提出相关性特征选择方法(CFS),在众多物料特征中确定由特征I_(H)、I_(L)、x、T_(ML)和T_(MH)组成的最优特征子集。通过采用不同物料特征组合方法进行对比实验,并选择最优特征子集下K-最近邻(KNN)作为最优分类模型。实验结果表明:基于相关性特征选择K-最近邻(CFS-KNN)的废有色金属物料识别分类方法与已有分类方法相比用相对较少的特征获得更高的识别准确度(96.13%)。 展开更多
关键词 特征选择 相关性 k-最近邻 废金属 分类
下载PDF
基于EDA的加权KNN分类算法
11
作者 谢雨寒 潘峰 《计算机时代》 2023年第8期37-40,共4页
针对传统K近邻(KNN)算法对不平衡数据集分类的不足,提出一种基于分布估计算法改进的加权KNN算法EDA-KNN。在没有先验知识的前提下,为了求解最优加权KNN算法的权重向量,构建矩阵结构种群。运用分布估计算法建立概率模型,进行采样、寻优... 针对传统K近邻(KNN)算法对不平衡数据集分类的不足,提出一种基于分布估计算法改进的加权KNN算法EDA-KNN。在没有先验知识的前提下,为了求解最优加权KNN算法的权重向量,构建矩阵结构种群。运用分布估计算法建立概率模型,进行采样、寻优等一系列操作,经过若干次迭代,最终获得使样本分类准确率达到最高的权重向量。通过对多个数据集进行分类,结果表明,EDA-KNN算法能够显著提升对于不平衡数据集分类的准确率,分类器性能稳定。 展开更多
关键词 不平衡数据集 knn算法 分布估计算法 矩阵结构 分级权重
下载PDF
基于KNN和自适应的过采样方法
12
作者 张怀啸 陈卓 周必良 《信息与电脑》 2023年第3期93-95,共3页
针对少数类合成过采样技术(Synthetic Minority Oversampling Technique,SMOTE)及其改进算法在不平衡数据分类问题中分类效果不佳,提出了基于K最邻近算法(K-NearestNeighbor,KNN)和自适应的过采样方法(Oversampling Method Based on KNN... 针对少数类合成过采样技术(Synthetic Minority Oversampling Technique,SMOTE)及其改进算法在不平衡数据分类问题中分类效果不佳,提出了基于K最邻近算法(K-NearestNeighbor,KNN)和自适应的过采样方法(Oversampling Method Based on KNN and Adaptive,KAO)。首先,利用KNN去除噪声样本;其次,根据少数类样本K近邻样本中多数类样本数,自适应给少数类样本分配过采样权重;最后,利用新的插值方式生成新样本平衡数据集。在KEEL公开的数据集上进行实验,将提出的KAO算法与SMOTE及其改进算法进行对比,在F1值和g-mean上都有所提升。 展开更多
关键词 不平衡数据分类 少数类合成过采样技术(SMOTE) k最邻近算法(knn) 自适应 过采样
下载PDF
基于KNN算法的网络入侵检测技术开发 被引量:1
13
作者 吴晟懿 《信息与电脑》 2023年第5期67-69,共3页
传统算法在网络入侵检测方面存在部分问题,为了进一步提升检测水平,在网络信息攻击手段日益增多的背景下,提出了一种基于最邻近结点(K-NearestNeighbor,KNN)算法的网络入侵检测技术方法。该方法将粒子优化解决局部极值问题,以实现改善... 传统算法在网络入侵检测方面存在部分问题,为了进一步提升检测水平,在网络信息攻击手段日益增多的背景下,提出了一种基于最邻近结点(K-NearestNeighbor,KNN)算法的网络入侵检测技术方法。该方法将粒子优化解决局部极值问题,以实现改善网络入侵检测技术的目的。测试结果表明,基于KNN算法的网络入侵检测技术能够较好地识别攻击类型,其误检率显著优于Rabin-Karp、Boyer-Moore、Colussi这3种传统算法,验证了算法的有效性,能够较好地应用于网络入侵行为的预测,表现出良好的预测精度。 展开更多
关键词 knn算法 网络入侵检测 粒子群落 迭代
下载PDF
Classification Fusion in Wireless Sensor Networks 被引量:3
14
作者 LIU Chun-Ting HUO Hong +2 位作者 FANG Tao LI De-Ren SHEN Xiao 《自动化学报》 EI CSCD 北大核心 2006年第6期947-955,共9页
In wireless sensor networks, target classification differs from that in centralized sensing systems because of the distributed detection, wireless communication and limited resources. We study the classification probl... In wireless sensor networks, target classification differs from that in centralized sensing systems because of the distributed detection, wireless communication and limited resources. We study the classification problem of moving vehicles in wireless sensor networks using acoustic signals emitted from vehicles. Three algorithms including wavelet decomposition, weighted k-nearest-neighbor and Dempster-Shafer theory are combined in this paper. Finally, we use real world experimental data to validate the classification methods. The result shows that wavelet based feature extraction method can extract stable features from acoustic signals. By fusion with Dempster's rule, the classification performance is improved. 展开更多
关键词 Wireless sensor networks classification fusion wavelet decomposition weighted k-nearest-neighbor Dempster-Shafer theory
下载PDF
基于EEMD-kNN的工业过程微小故障检测
15
作者 郭小萍 滕佳岐 李元 《计算机应用与软件》 北大核心 2023年第4期36-40,53,共6页
针对非线性工业过程早期发生的微小故障不易检出的问题,提出一种基于集合经验模态分解(Ensemble empirical Mode Decomposition,EEMD)的k近邻(k-Nearest Neighbor,kNN)指标累积和故障检测方法(EEMD-kNN)。通过EEMD预处理原始建模数据,... 针对非线性工业过程早期发生的微小故障不易检出的问题,提出一种基于集合经验模态分解(Ensemble empirical Mode Decomposition,EEMD)的k近邻(k-Nearest Neighbor,kNN)指标累积和故障检测方法(EEMD-kNN)。通过EEMD预处理原始建模数据,在本征函数构建的数据空间中引入kNN规则,提出构造一种加权因子来强化特征,使重构建模数据集更好地包含数据的非线性特征;再一次采用kNN规则提取重构样本的非线性特征,并构建k近邻距离平方累积和统计量,通过核密度估计法确定其控制限。通过一个数值案例和TE(Tenessee Eastman)过程进行实验仿真,并与kNN和EEMD-PCA方法进行对比,结果验证了该方法的有效性。 展开更多
关键词 集合经验模态分解 k近邻 非线性 微小故障检测
下载PDF
基于ICA-CSP-KNN的运动想象脑电意图识别
16
作者 鲍甜恬 欧阳虹霞 +1 位作者 杨天宇 陈伊桓 《科技创新与应用》 2023年第30期6-9,共4页
运动想象意图识别的准确率的提高对脑-机接口技术的发展具有重要意。该文以第Ⅳ届BCI竞赛的数据集Ⅰ的运动想象EEG信号为基础,采用ICA-CSP-KNN相结合的方法对脑电信号进行意图识别。首先用独立成分分解(ICA)对脑电信号进行预处理,去除... 运动想象意图识别的准确率的提高对脑-机接口技术的发展具有重要意。该文以第Ⅳ届BCI竞赛的数据集Ⅰ的运动想象EEG信号为基础,采用ICA-CSP-KNN相结合的方法对脑电信号进行意图识别。首先用独立成分分解(ICA)对脑电信号进行预处理,去除其中包含的眼电等干扰噪声,利用共空间模式(Common Spatial Pattern,CSP)进行特征提取,最后采用K邻近算法(K-Nearest Neighbor,KNN)进行特征分类。实验结果表明,该方法的分类准确率均达到93%,有效实现运动想象解码,证明该方法的有效性。 展开更多
关键词 脑电信号 运动想象 共空间模式 k邻近 ICA-CSP-knn
下载PDF
基于改进KNN的不均衡信息文本分类算法
17
作者 马召贵 《信息与电脑》 2023年第12期85-87,共3页
针对常规文本分类算法存在文本特征提取不全面的问题,提出基于改进K近邻(K-Nearest Neighbor,KNN)的不均衡信息文本分类算法。首先,通过文本分词与去停用词两个步骤,对不均衡信息文本进行预处理,避免无用数据对分类结果产生干扰。其次,... 针对常规文本分类算法存在文本特征提取不全面的问题,提出基于改进K近邻(K-Nearest Neighbor,KNN)的不均衡信息文本分类算法。首先,通过文本分词与去停用词两个步骤,对不均衡信息文本进行预处理,避免无用数据对分类结果产生干扰。其次,利用互信息特征提取方法,提取不均衡信息文本特征,获取文本特征词与类别之间的相关程度。最后,利用改进KNN原理对待测不均衡信息文本数据进行邻近聚类,设计文本分类算法。实验结果表明,该算法的分类查准率始终在98%以上,优于对照组。 展开更多
关键词 k近邻(knn) 不均衡 信息文本 分类算法
下载PDF
KNN数据挖掘算法在北京地区霾等级预报中的应用 被引量:51
18
作者 熊亚军 廖晓农 +6 位作者 李梓铭 张小玲 孙兆彬 赵秀娟 赵普生 马小会 蒲维维 《气象》 CSCD 北大核心 2015年第1期98-104,共7页
利用北京地区2013年气象数据以及PM_(2.5)浓度数据与能见度数据进行对比分析,结果发现气温、气压、相对湿度、露点温度、地面U风、地面V风以及PM_(2.5)小时浓度这7个要素是影响北京地区霾等级的关键因素。利用气温、地面气压、相对湿度... 利用北京地区2013年气象数据以及PM_(2.5)浓度数据与能见度数据进行对比分析,结果发现气温、气压、相对湿度、露点温度、地面U风、地面V风以及PM_(2.5)小时浓度这7个要素是影响北京地区霾等级的关键因素。利用气温、地面气压、相对湿度、露点温度、U风、V风分量以及PM_(2.5)浓度作为7个属性特征,以霾等级做为标志量构建训练样本集,结合KNN(KNearest Neighbor)数据挖掘算法构建疆等级预报分类器,并开展霾等级客观识别实验。结果表明K=3时该分类器的分类预报效果最佳,其13个站点的分类准确率高达88.2%。基于该算法构建的KNN模型预报无霾时的漏报概率很小,准确率高达91.8%;预报有轻度霾、中度霾以及重度霾时,空报的概率仅分别为4.7%、1.4%和2.6%。2014年8月29日至9月2日北京地区一次霾天气过程的预报结果表明:南郊观象台、密云和延庆3站的预报准确率分别达到74%、64%和84%,但霾等级的精度方面还有待于进一步提高。 展开更多
关键词 数据挖掘 knn 预报
下载PDF
改进型加权KNN算法的不平衡数据集分类 被引量:25
19
作者 王超学 潘正茂 +2 位作者 马春森 董丽丽 张涛 《计算机工程》 CAS CSCD 2012年第20期160-163,168,共5页
K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚... K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚类,按照权重分配模型计算各训练样本的权重,通过改进的KNN算法对测试样本进行分类。基于UCI数据集的大量实验结果表明,GAK-KNN算法的识别率和整体性能都优于传统KNN算法及其他改进算法。 展开更多
关键词 不平衡数据集 分类 k最邻近算法 权重分配模型 遗传算法 k-MEANS算法
下载PDF
A Representation-Based Pseudo Nearest Neighbor Classifier
20
作者 Yanwei Qi 《国际计算机前沿大会会议论文集》 2018年第1期13-13,共1页
下载PDF
上一页 1 2 32 下一页 到第
使用帮助 返回顶部