期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
Enhancing Cancer Classification through a Hybrid Bio-Inspired Evolutionary Algorithm for Biomarker Gene Selection
1
作者 Hala AlShamlan Halah AlMazrua 《Computers, Materials & Continua》 SCIE EI 2024年第4期675-694,共20页
In this study,our aim is to address the problem of gene selection by proposing a hybrid bio-inspired evolutionary algorithm that combines Grey Wolf Optimization(GWO)with Harris Hawks Optimization(HHO)for feature selec... In this study,our aim is to address the problem of gene selection by proposing a hybrid bio-inspired evolutionary algorithm that combines Grey Wolf Optimization(GWO)with Harris Hawks Optimization(HHO)for feature selection.Themotivation for utilizingGWOandHHOstems fromtheir bio-inspired nature and their demonstrated success in optimization problems.We aimto leverage the strengths of these algorithms to enhance the effectiveness of feature selection in microarray-based cancer classification.We selected leave-one-out cross-validation(LOOCV)to evaluate the performance of both two widely used classifiers,k-nearest neighbors(KNN)and support vector machine(SVM),on high-dimensional cancer microarray data.The proposed method is extensively tested on six publicly available cancer microarray datasets,and a comprehensive comparison with recently published methods is conducted.Our hybrid algorithm demonstrates its effectiveness in improving classification performance,Surpassing alternative approaches in terms of precision.The outcomes confirm the capability of our method to substantially improve both the precision and efficiency of cancer classification,thereby advancing the development ofmore efficient treatment strategies.The proposed hybridmethod offers a promising solution to the gene selection problem in microarray-based cancer classification.It improves the accuracy and efficiency of cancer diagnosis and treatment,and its superior performance compared to other methods highlights its potential applicability in realworld cancer classification tasks.By harnessing the complementary search mechanisms of GWO and HHO,we leverage their bio-inspired behavior to identify informative genes relevant to cancer diagnosis and treatment. 展开更多
关键词 Bio-inspired algorithms BIOINFORMATICS cancer classification evolutionary algorithm feature selection gene expression grey wolf optimizer harris hawks optimization k-nearest neighbor support vector machine
下载PDF
面向申威架构的KNN并行算法实现与优化 被引量:2
2
作者 王其涵 庞建民 +3 位作者 岳峰 祝迪 沈莉 肖谦 《计算机工程》 CAS CSCD 北大核心 2023年第5期286-294,共9页
K近邻(KNN)是人工智能中最常用的分类算法,其性能提升对于海量数据的整理分析、大数据分类等任务具有重要意义。目前新一代神威超级计算机正处于应用发展的初始阶段,结合新一代申威异构众核处理器的结构特性,充分利用庞大的计算资源实... K近邻(KNN)是人工智能中最常用的分类算法,其性能提升对于海量数据的整理分析、大数据分类等任务具有重要意义。目前新一代神威超级计算机正处于应用发展的初始阶段,结合新一代申威异构众核处理器的结构特性,充分利用庞大的计算资源实现高效的KNN算法是海量数据分析整理的现实需求。根据SW26010pro处理器的结构特性,采用主从加速编程模型实现一种基础版本的KNN并行算法,其将计算核心传输到从核上,实现了线程级并行。分析影响基础并行算法性能的关键因素并提出优化算法SWKNN,不同于基础并行KNN算法的任务划分方式,SWKNN采用任务重划分策略,以避免冗余计算开销。通过数据流水优化、从核间通信优化、二次负载均衡优化等步骤减少不必要的通信开销,从而有效缓解访存压力并进一步提升算法性能。实验结果表明,与串行KNN算法相比,面向申威架构的基础并行KNN算法在SW26010pro处理器的单核组上可以获得最高48倍的加速效果,在同等数据规模下,SWKNN算法较基础并行KNN算法又可以获得最高399倍的加速效果。 展开更多
关键词 异构众核处理器 K近邻算法 并行计算 算法优化 分类性能
下载PDF
基于改进KNN的不均衡信息文本分类算法
3
作者 马召贵 《信息与电脑》 2023年第12期85-87,共3页
针对常规文本分类算法存在文本特征提取不全面的问题,提出基于改进K近邻(K-Nearest Neighbor,KNN)的不均衡信息文本分类算法。首先,通过文本分词与去停用词两个步骤,对不均衡信息文本进行预处理,避免无用数据对分类结果产生干扰。其次,... 针对常规文本分类算法存在文本特征提取不全面的问题,提出基于改进K近邻(K-Nearest Neighbor,KNN)的不均衡信息文本分类算法。首先,通过文本分词与去停用词两个步骤,对不均衡信息文本进行预处理,避免无用数据对分类结果产生干扰。其次,利用互信息特征提取方法,提取不均衡信息文本特征,获取文本特征词与类别之间的相关程度。最后,利用改进KNN原理对待测不均衡信息文本数据进行邻近聚类,设计文本分类算法。实验结果表明,该算法的分类查准率始终在98%以上,优于对照组。 展开更多
关键词 K近邻(knn) 不均衡 信息文本 分类算法
下载PDF
改进型加权KNN算法的不平衡数据集分类 被引量:26
4
作者 王超学 潘正茂 +2 位作者 马春森 董丽丽 张涛 《计算机工程》 CAS CSCD 2012年第20期160-163,168,共5页
K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚... K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚类,按照权重分配模型计算各训练样本的权重,通过改进的KNN算法对测试样本进行分类。基于UCI数据集的大量实验结果表明,GAK-KNN算法的识别率和整体性能都优于传统KNN算法及其他改进算法。 展开更多
关键词 不平衡数据集 分类 K最邻近算法 权重分配模型 遗传算法 K-MEANS算法
下载PDF
基于KNN的特征自适应加权自然图像分类研究 被引量:17
5
作者 侯玉婷 彭进业 +1 位作者 郝露微 王瑞 《计算机应用研究》 CSCD 北大核心 2014年第3期957-960,共4页
针对自然图像类型广泛、结构复杂、分类精度不高的实际问题,提出了一种为自然图像不同特征自动加权值的K-近邻(K-nearest neighbors,KNN)分类方法。通过分析自然图像的不同特征对于分类结果的影响,采用基因遗传算法求得一组最优分类权... 针对自然图像类型广泛、结构复杂、分类精度不高的实际问题,提出了一种为自然图像不同特征自动加权值的K-近邻(K-nearest neighbors,KNN)分类方法。通过分析自然图像的不同特征对于分类结果的影响,采用基因遗传算法求得一组最优分类权值向量解,利用该最优权值对自然图像纹理和颜色两个特征分别进行加权,最后用自适应加权K-近邻算法实现对自然图像的分类。实验结果表明,在用户给定分类精度需求和低时间复杂度的约束下,算法能快速、高精度地进行自然图像分类。提出的自适应加权K-近邻分类方法对于门类繁多的自然图像具有普遍适用性,可以有效地提高自然图像的分类性能。 展开更多
关键词 K-近邻算法 基因算法 自然图像分类 特征加权
下载PDF
基于k-最近邻图的小样本KNN分类算法 被引量:27
6
作者 刘应东 牛惠民 《计算机工程》 CAS CSCD 北大核心 2011年第9期198-200,共3页
提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对... 提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对象进行类别标识。采用标准数据集进行测试,结果表明该算法在小样本情况下能够提高KNN的分类精度,减小最近邻阈值k对分类效果的影响。 展开更多
关键词 knn算法 k-最近邻图 小样本 图划分 分类算法
下载PDF
离散型增强烟花算法和kNN在特征选择中的研究 被引量:4
7
作者 黄欣 莫海淼 +1 位作者 赵志刚 曾敏 《计算机工程与应用》 CSCD 北大核心 2020年第16期112-117,共6页
特征选择是从原始特征集中选取特征子集,并且降低特征维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,提出了新的特征选择算法。该算法使用经过离散化处理之后的增强烟花算法来搜索特征子集,同时将特征子集和经过惩... 特征选择是从原始特征集中选取特征子集,并且降低特征维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,提出了新的特征选择算法。该算法使用经过离散化处理之后的增强烟花算法来搜索特征子集,同时将特征子集和经过惩罚因子处理之后约束条件融入到目标函数中,然后将搜索到的特征子集的数据放到kNN分类器进行训练和预测,最后使用十折交叉验证来检验分类的准确性。使用UCI数据进行仿真实验,仿真结果表明:与引导型烟花算法、烟花算法、蝙蝠算法、乌鸦算法、自适应粒子群算法相比,所提算法的总体性能优于其他五种算法。 展开更多
关键词 离散型增强烟花算法 特征选择 降维 分类 k近邻(knn)
下载PDF
基于CEEMD和优化KNN的离心泵故障诊断方法 被引量:10
8
作者 杨波 黄倩 +1 位作者 付强 朱荣生 《机电工程》 CAS 北大核心 2022年第11期1502-1509,共8页
卧式离心泵实际测量中背景噪声含量较大,故障特征常被淹没,导致机械故障诊断效果较差,为了实时、精准地获得其运行状态,或对其进行故障诊断,提出了一种基于互补集合经验模态分解(CEEMD)和优化最邻近(KNN)算法的卧式离心泵机械故障诊断... 卧式离心泵实际测量中背景噪声含量较大,故障特征常被淹没,导致机械故障诊断效果较差,为了实时、精准地获得其运行状态,或对其进行故障诊断,提出了一种基于互补集合经验模态分解(CEEMD)和优化最邻近(KNN)算法的卧式离心泵机械故障诊断方法。首先,采集了卧式离心泵机械故障加速度信号,使用CEEMD对信号进行了一次分解,得到了本征模函数(IMF),采用相关系数法得到了IMF相关系数,确定了相关分量与不相关分量;其次,通过改进小波阈值去噪方法对不相关分量进行处理,提取了重构信号可分析的时频故障特征;最后,搭建了离心泵实验台,采用上述故障诊断方法对离心泵机械故障进行了分类诊断。研究结果表明:经CEEMD降噪后,信号评价指标信噪比(SNR)为2.2571,比原来的去噪方法提升了0.4381;优化后KNN分类对于卧式离心泵的机械故障诊断准确率可达96.7%,能够有效识别离心泵故障,达到智能诊断的目的。 展开更多
关键词 叶片式泵 故障信号分解 互补集合经验模态分解 改进小波阈值降噪 优化最邻近算法分类 本征模函数 相关分量/不相关分量
下载PDF
用于WEB文档分类的并行KNN算法 被引量:1
9
作者 周朴雄 《计算机工程与应用》 CSCD 北大核心 2008年第25期155-156,共2页
针对WEB文档分类中KNN算法计算复杂度高的缺点,不同于以往从减少训练样本集大小和采用快速算法角度来降低KNN算法的计算复杂度,从并行的角度出发,提出一种在Hyper-cube SIMD模型上的并行算法,其关键部分的时间计算复杂度从O(n2)降为O(lo... 针对WEB文档分类中KNN算法计算复杂度高的缺点,不同于以往从减少训练样本集大小和采用快速算法角度来降低KNN算法的计算复杂度,从并行的角度出发,提出一种在Hyper-cube SIMD模型上的并行算法,其关键部分的时间计算复杂度从O(n2)降为O(log(n)),该算法与传统的串行算法相比,能显著地提高分类速度。 展开更多
关键词 文档分类 K最近邻 并行策略
下载PDF
一种基于Canopy和粗糙集的CRS-KNN文本分类算法 被引量:9
10
作者 姚彬修 倪建成 +2 位作者 于苹苹 曹博 李淋淋 《计算机工程与应用》 CSCD 北大核心 2017年第11期172-177,共6页
针对KNN算法的分类效率随着训练集规模和特征维数的增加而逐渐降低的问题,提出了一种基于Canopy和粗糙集的CRS-KNN(Canopy Rough Set-KNN)文本分类算法。算法首先将待处理的文本数据通过Canopy进行聚类,然后对得到的每个类簇运用粗糙集... 针对KNN算法的分类效率随着训练集规模和特征维数的增加而逐渐降低的问题,提出了一种基于Canopy和粗糙集的CRS-KNN(Canopy Rough Set-KNN)文本分类算法。算法首先将待处理的文本数据通过Canopy进行聚类,然后对得到的每个类簇运用粗糙集理论进行上、下近似分割,对于分割得到的下近似区域无需再进行分类,而通过上、下近似作差所得的边界区域数据需要通过KNN算法确定其最终的类别。实验结果表明,该算法降低了KNN算法的数据计算规模,提高了分类效率。同时与传统的KNN算法和基于聚类改进的KNN文本分类算法相比,准确率、召回率和F_1值都得到了一定的提高。 展开更多
关键词 Canopy聚类 粗糙集 K-最近邻(knn)算法 文本分类
下载PDF
基于粗糙KNN算法的文本分类方法 被引量:5
11
作者 王渊 刘业政 姜元春 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第12期1513-1517,共5页
在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空... 在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空间,将文本向量空间分为核心和混合2大区域;然后改进传统KNN算法的隶属度函数;再针对不同的文本区域,采取差异化的分类策略以提高分类的效率和准确率。实验表明,基于粗糙KNN算法的文本分类方法在提高分类准确率的同时,分类的效率也有很大提高。 展开更多
关键词 文本分类 粗糙集 knn算法 核心区域 混合区域
下载PDF
基于BP改进的KNN算法在北京密云土地覆盖分类中的应用 被引量:8
12
作者 王佃来 宿爱霞 刘文萍 《科学技术与工程》 北大核心 2020年第23期9464-9471,共8页
针对k近邻(k-nearest neighbor,KNN)算法在土地覆盖分类中存在将山体阴影覆盖下植被误分成水体的问题,提出改进的KNN算法。改进算法充分利用神经网络能有效区分山体阴影覆盖下植被和水体的特性,实现BP神经网络与KNN算法的融合,整体提高... 针对k近邻(k-nearest neighbor,KNN)算法在土地覆盖分类中存在将山体阴影覆盖下植被误分成水体的问题,提出改进的KNN算法。改进算法充分利用神经网络能有效区分山体阴影覆盖下植被和水体的特性,实现BP神经网络与KNN算法的融合,整体提高了北京市密云区土地覆盖分类精度。实验结果表明:相对于支持向量机(support vector machine,SVM)、随机森林、BP神经网络和KNN算法,改进算法分类精度最高,达到了95.20%,分类精度比未改进KNN算法提高了6.43%。改进算法的Kappa系数在对比算法中也是最高的,达到0.93。此外,实验结果也表明改进算法可应用于中分辨率遥感图像分类中。 展开更多
关键词 knn算法 土地覆盖分类 遥感图像 BP神经网络
下载PDF
基于BP神经网络决策的KNN改进算法 被引量:18
13
作者 路敦利 宁芊 臧军 《计算机应用》 CSCD 北大核心 2017年第A02期65-67,88,共4页
针对K近邻(KNN)算法中算法精度受K值选取影响较大的问题,提出了一种使用BP神经网络来优化KNN算法的改进算法来降低K值选取对算法精度的影响同时提高K近邻算法的准确率。所提改进算法主要是使用BP神经网络对K近邻算法分类完成后的结果进... 针对K近邻(KNN)算法中算法精度受K值选取影响较大的问题,提出了一种使用BP神经网络来优化KNN算法的改进算法来降低K值选取对算法精度的影响同时提高K近邻算法的准确率。所提改进算法主要是使用BP神经网络对K近邻算法分类完成后的结果进行改进优化。首先,通过对训练样本使用K值不同的K近邻算法进行初步分类,同一数据会得到多个不同的初步分类结果集;然后将初步分类结果集作为BP神经网络的输入,再对BP神经网络进行训练分类。在多个数据集上的实验表明,基于BP神经网络决策的K近邻改进算法降低了K值对算法精度的影响,同时极大地提高了分类的准确率。 展开更多
关键词 K近邻 BP神经网络 算法精度 分类算法 K值
下载PDF
结合属性值贡献度与平均相似度的KNN改进算法 被引量:1
14
作者 张玲珠 周忠眉 《计算机工程与应用》 CSCD 北大核心 2010年第18期130-131,共2页
与传统的K-近邻算法不同,提出了一种结合属性值贡献度与平均相似度的KNN改进算法。首先考虑测试样本与相似样本点间的平均相似度,其次考虑不同类别中的相似样本点的个数,最后还考虑与相似样本相同的属性值对类别的贡献度。在蘑菇数据集... 与传统的K-近邻算法不同,提出了一种结合属性值贡献度与平均相似度的KNN改进算法。首先考虑测试样本与相似样本点间的平均相似度,其次考虑不同类别中的相似样本点的个数,最后还考虑与相似样本相同的属性值对类别的贡献度。在蘑菇数据集上进行实验结果表明,改进后的KNN分类算法的准确率比传统的K-近邻分类算法的准确率更高。 展开更多
关键词 分类 K-近邻算法 相似度
下载PDF
A Memetic Algorithm With Competition for the Capacitated Green Vehicle Routing Problem 被引量:8
15
作者 Ling Wang Jiawen Lu 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2019年第2期516-526,共11页
In this paper, a memetic algorithm with competition(MAC) is proposed to solve the capacitated green vehicle routing problem(CGVRP). Firstly, the permutation array called traveling salesman problem(TSP) route is used t... In this paper, a memetic algorithm with competition(MAC) is proposed to solve the capacitated green vehicle routing problem(CGVRP). Firstly, the permutation array called traveling salesman problem(TSP) route is used to encode the solution, and an effective decoding method to construct the CGVRP route is presented accordingly. Secondly, the k-nearest neighbor(k NN) based initialization is presented to take use of the location information of the customers. Thirdly, according to the characteristics of the CGVRP, the search operators in the variable neighborhood search(VNS) framework and the simulated annealing(SA) strategy are executed on the TSP route for all solutions. Moreover, the customer adjustment operator and the alternative fuel station(AFS) adjustment operator on the CGVRP route are executed for the elite solutions after competition. In addition, the crossover operator is employed to share information among different solutions. The effect of parameter setting is investigated using the Taguchi method of design-ofexperiment to suggest suitable values. Via numerical tests, it demonstrates the effectiveness of both the competitive search and the decoding method. Moreover, extensive comparative results show that the proposed algorithm is more effective and efficient than the existing methods in solving the CGVRP. 展开更多
关键词 Capacitated green VEHICLE ROUTING problem(CGVRP) COMPETITION k-nearest neighbor(knn) local INTENSIFICATION memetic algorithm
下载PDF
A systematic approach in load disaggregation utilizing a multi-stage classification algorithm for consumer electrical appliances classification 被引量:5
16
作者 Chuan Choong YANG Chit Siang SOH Vooi Voon YAP 《Frontiers in Energy》 SCIE CSCD 2019年第2期386-398,共13页
The potential to save energy in existing consumer electrical appliances is very high. One of the ways to achieve energy saving and improve energy use awareness is to recognize the energy consumption of individual elec... The potential to save energy in existing consumer electrical appliances is very high. One of the ways to achieve energy saving and improve energy use awareness is to recognize the energy consumption of individual electrical appliances. To recognize the energy consumption of consumer electrical appliances, the load disaggregation methodology is utilized. Non-intrusive appliance load monitoring (NIALM) is a load disaggrega-tion methodology that disaggregates the sum of power consumption in a single point into the power consumption of individual electrical appliances. In this study, load disaggregation is performed through voltage and current waveform, known as the V-I trajectory. The classification algorithm performs cropping and image pyramid reduction of the V-I trajectory plot template images before utilizing the principal component analysis (PCA) and the k-nearest neighbor (k-NN) algorithm. The novelty of this paper is to establish a systematic approach of load disaggregation through V-I trajectory-based load signature images by utilizing a multi-stage classification algorithm methodol-ogy. The contribution of this paper is in utilizing the “k- value,” the number of closest data points to the nearest neighbor, in the k-NN algorithm to be effective in classification of electrical appliances. The results of the multi-stage classification algorithm implementation have been discussed and the idea on future work has also been proposed. 展开更多
关键词 LOAD DISAGGREGATION voltage-current (V-I) trajectory MULTI-STAGE classification algorithm principal component analysis (PCA) k-nearest neighbor (k-NN)
原文传递
An Optimization System for Intent Recognition Based on an Improved KNN Algorithm with Minimal Feature Set for Powered Knee Prosthesis
17
作者 Yao Zhang Xu Wang +6 位作者 Haohua Xiu Lei Ren Yang Han Yongxin Ma Wei Chen Guowu Wei Luquan Ren 《Journal of Bionic Engineering》 SCIE EI CSCD 2023年第6期2619-2632,共14页
In this article,a new optimization system that uses few features to recognize locomotion with high classification accuracy is proposed.The optimization system consists of three parts.First,the features of the mixed me... In this article,a new optimization system that uses few features to recognize locomotion with high classification accuracy is proposed.The optimization system consists of three parts.First,the features of the mixed mechanical signal data are extracted from each analysis window of 200 ms after each foot contact event.Then,the Binary version of the hybrid Gray Wolf Optimization and Particle Swarm Optimization(BGWOPSO)algorithm is used to select features.And,the selected features are optimized and assigned different weights by the Biogeography-Based Optimization(BBO)algorithm.Finally,an improved K-Nearest Neighbor(KNN)classifier is employed for intention recognition.This classifier has the advantages of high accuracy,few parameters as well as low memory burden.Based on data from eight patients with transfemoral amputations,the optimization system is evaluated.The numerical results indicate that the proposed model can recognize nine daily locomotion modes(i.e.,low-,mid-,and fast-speed level-ground walking,ramp ascent/decent,stair ascent/descent,and sit/stand)by only seven features,with an accuracy of 96.66%±0.68%.As for real-time prediction on a powered knee prosthesis,the shortest prediction time is only 9.8 ms.These promising results reveal the potential of intention recognition based on the proposed system for high-level control of the prosthetic knee. 展开更多
关键词 Intent recognition k-nearest neighbor algorithm Powered knee prosthesis Locomotion mode classification
原文传递
基于电源线和位置指纹的室内定位技术 被引量:9
18
作者 何坚 万志江 刘金伟 《电子与信息学报》 EI CSCD 北大核心 2014年第12期2902-2908,共7页
该文提出将室内环境不可或缺的电源线作为天线,通过在电源线上注入宽带高频信号构造室内空间的位置指纹,进而实现室内空间精确定位。首先介绍了电源线上宽带高频信号注入模块的实现技术,以及室内空间位置指纹的构造方法;其次,介绍了基... 该文提出将室内环境不可或缺的电源线作为天线,通过在电源线上注入宽带高频信号构造室内空间的位置指纹,进而实现室内空间精确定位。首先介绍了电源线上宽带高频信号注入模块的实现技术,以及室内空间位置指纹的构造方法;其次,介绍了基于朴素贝叶斯分类算法的室内定位原理;最后,通过实验分析证明在多训练样本情况下,基于朴素贝叶斯分类算法的定位算法比基于K最邻近点(KNN)分类算法的定位算法有更好的定位准确率和时间迁移适应能力。 展开更多
关键词 室内定位 位置指纹 朴素贝叶斯分类算法 K最邻近点
下载PDF
基于改进K最近邻分类算法的不良网页并行识别 被引量:6
19
作者 徐雅斌 李卓 陈俊伊 《计算机应用》 CSCD 北大核心 2013年第12期3368-3371,3379,共5页
互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处... 互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处理。对比实验结果表明,所采用的识别方法的识别准确率和识别效率都有较大的提高。 展开更多
关键词 不良网页 文本分类 K最近邻分类算法 HADOOP MAPREDUCE
下载PDF
熵可视化方法在恶意代码分类中的应用 被引量:9
20
作者 任卓君 陈光 《计算机工程》 CAS CSCD 北大核心 2017年第9期167-171,共5页
恶意代码激增极大地威胁着信息系统安全。为提高辨识效率,加快应急响应速度,结合信息熵的定义,利用Jaccard度量和K最近邻分类算法,提出一种新的用于研究恶意代码分类的可视化方法。将二进制文件经局部熵计算转换成熵像素图,从视觉角度... 恶意代码激增极大地威胁着信息系统安全。为提高辨识效率,加快应急响应速度,结合信息熵的定义,利用Jaccard度量和K最近邻分类算法,提出一种新的用于研究恶意代码分类的可视化方法。将二进制文件经局部熵计算转换成熵像素图,从视觉角度直观呈现恶意代码内部特征,通过降维显示机制提高相似度比对和分类的效率。实验结果表明,该方法使用66个族的664个由卡巴斯基命名规则命名的样本进行评估,平均分类准确率为93.67%,能有效地分类恶意代码样本。 展开更多
关键词 恶意代码 可视化 谱系分类 信息熵 Jaccard指数 K最近邻分类算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部