期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于PSO和KNN的网页智能分类算法 被引量:1
1
作者 唐朝霞 《太原师范学院学报(自然科学版)》 2010年第4期55-58,共4页
随着Internet技术的不断发展,Web信息不断的变化和增长.为有效查找用户所需要的信息,需将传统的信息检索向Web信息检索方向发展.如果预先对网页文本进行分类,则面对用户的检索需求就可以在相应的类别中进行查找,这样大大提高了检索的效... 随着Internet技术的不断发展,Web信息不断的变化和增长.为有效查找用户所需要的信息,需将传统的信息检索向Web信息检索方向发展.如果预先对网页文本进行分类,则面对用户的检索需求就可以在相应的类别中进行查找,这样大大提高了检索的效率.文章通过对网页进行预处理,中文分词,特征提取,再使用KNN分类算法对网页进行智能分类,并采用了PSO算法快速寻找K近邻.实验结果表明:该方法不仅减少了网页分类时间,准确率、召回率和F1标准也明显提高,有效地提高了网页智能分类的效率. 展开更多
关键词 中文分词 特征提取 智能分类 knn分类算法 pso算法
下载PDF
基于改进KNN算法的新能源发电单元运行状态识别 被引量:2
2
作者 史林军 戴滔 +5 位作者 劳文洁 吴峰 林克曼 李杨 朱玲 黄锡芳 《电力自动化设备》 EI CSCD 北大核心 2024年第5期65-72,共8页
目前识别发电单元运行状态的研究较少,数据来源以数据采集与监控系统为主,采集速度较慢。为此,提出了一种基于发电单元机端电气量数据并融合改进k近邻(KNN)算法的新能源发电单元状态识别方法,直接采集机端电气量数据用于快速判断发电单... 目前识别发电单元运行状态的研究较少,数据来源以数据采集与监控系统为主,采集速度较慢。为此,提出了一种基于发电单元机端电气量数据并融合改进k近邻(KNN)算法的新能源发电单元状态识别方法,直接采集机端电气量数据用于快速判断发电单元状态。提出KNN算法的改进策略,克服了传统KNN算法准确度低、识别速度慢的缺点。利用电力系统分析综合程序获取用于状态识别的发电单元机端电气量数据,利用改进策略对数据进行预处理,并对比传统KNN算法、逐条使用改进策略的KNN算法对新能源发电单元状态识别的耗时与准确度。结果表明所提算法较传统算法的识别准确度和速度明显提升,能满足稳定控制过程中对新能源发电单元的状态感知需求。 展开更多
关键词 状态识别 改进knn算法 新能源发电单元 特征提取 特征加权
下载PDF
基于特征加权的KNN模型岩性识别方法 被引量:1
3
作者 郭雨姗 王万银 《物探与化探》 CAS 2024年第2期428-436,共9页
岩性识别是一项重要的地质工作,为固体矿产勘探与油气勘探奠定了坚实的地质基础。岩石物性是连接岩性和地球物理场的桥梁,可以通过物性之间的差异进行岩性识别,但不同岩石的物性数据往往存在一定重合,仅靠交会图无法准确地识别岩性。KN... 岩性识别是一项重要的地质工作,为固体矿产勘探与油气勘探奠定了坚实的地质基础。岩石物性是连接岩性和地球物理场的桥梁,可以通过物性之间的差异进行岩性识别,但不同岩石的物性数据往往存在一定重合,仅靠交会图无法准确地识别岩性。KNN(K近邻)模型是一种简单、直接的机器学习方法,准确度和灵敏度都很高,适用于多分类问题。基于此,本文将基于特征加权的KNN模型引入岩性识别中,该方法将传统KNN模型与属性特征的信息增益相结合,对不同特征赋予不同权重,可以直观地反映属性特征对分类的重要程度。实验证明,相比于传统KNN方法,基于特征加权的KNN模型对岩性交界处的识别能力有大幅提升,整体提高了岩性识别的准确性和稳定性。 展开更多
关键词 knn 岩性识别 信息增益 特征权重
下载PDF
基于加权KNN算法的脑电信号情绪识别 被引量:3
4
作者 蔡靖 袁守国 +1 位作者 李锐 徐梦辉 《电子技术应用》 2022年第10期25-30,35,共7页
情绪与人类的行为、家庭及社会密切相关。情绪不仅能反映人类的各种感觉、思想和行为,而且也是各种外部刺激所产生的心理和生理反应,所以在很多领域中对情绪的正确识别十分重要。情绪的变化会导致脑电图(EEG)信号发生变化,反之,这些变... 情绪与人类的行为、家庭及社会密切相关。情绪不仅能反映人类的各种感觉、思想和行为,而且也是各种外部刺激所产生的心理和生理反应,所以在很多领域中对情绪的正确识别十分重要。情绪的变化会导致脑电图(EEG)信号发生变化,反之,这些变化也反映了情绪状态。基于DEAP数据库,对EEG信号进行时域特征和频域特征提取,通过PCA主成分分析法对特征进行降维处理。利用加权KNN算法进行5折交叉验证训练,最终对兴奋(excited)、放松(relaxed)、沮丧(depressed)、愤怒(angry)4种情绪状态的识别准确率达到80%。 展开更多
关键词 EEG信号 主成分分析(PCA) 时域特征 频域特征 加权knn
下载PDF
用于色情网页过滤中的KNN算法改进 被引量:1
5
作者 康进峰 王国营 +1 位作者 梁春迎 谭晓贞 《计算机安全》 2009年第9期17-19,22,共4页
针对互联网日益泛滥的色情信息,分析了向量空间模型中KNN算法,并对它的缺陷进行了改进,将其运用于色情网页过滤中,提出了一种色情网页过滤解决方案。该方法首先对特征项的选取和权重计算的方法进行了优化,然后使用改进后KNN算法进行网... 针对互联网日益泛滥的色情信息,分析了向量空间模型中KNN算法,并对它的缺陷进行了改进,将其运用于色情网页过滤中,提出了一种色情网页过滤解决方案。该方法首先对特征项的选取和权重计算的方法进行了优化,然后使用改进后KNN算法进行网页分类。实验表明,通过改进,有效地降低了向量空间的维数,提高了网页分类的精度和速度,能有效地识别并过滤色情网页。 展开更多
关键词 knn算法 向量空间模型 特征选择 权重计算 色情网页过滤
下载PDF
基于特征加权KNN的非侵入式负荷识别方法 被引量:5
6
作者 朱浩 曹宁 +2 位作者 鹿浩 张正基 柯炜 《电子测量技术》 北大核心 2022年第8期70-75,共6页
针对不同稳态特征对识别结果的影响程度不同,并考虑到不平衡数据集造成的少数类误判的问题,提出一种基于特征加权KNN的非侵入式负荷识别方法。首先,采用熵权法计算特征权重,利用特征权重改进特征距离的计算。其次,根据样本数量和对应算... 针对不同稳态特征对识别结果的影响程度不同,并考虑到不平衡数据集造成的少数类误判的问题,提出一种基于特征加权KNN的非侵入式负荷识别方法。首先,采用熵权法计算特征权重,利用特征权重改进特征距离的计算。其次,根据样本数量和对应算法k值计算得到表决权重,带入投票表决过程中,以此来增加少数类的分类准确性。实验结果表明,针对实测负荷数据集时,本文算法的平均识别准确率为93.4%,与KNN算法相比提高了2.8%;针对公开数据集时,本文算法的平均准确率和F1得分分别为86.8%和81.6%,要优于其他4种分类算法。 展开更多
关键词 非侵入式 负荷识别 稳态特征 knn 特征权重 表决权重
下载PDF
基于PSO面向K近邻分类的特征权重学习算法 被引量:7
7
作者 任江涛 卓晓岚 +1 位作者 许盛灿 印鉴 《计算机科学》 CSCD 北大核心 2007年第5期187-189,共3页
特征权重学习是基于特征赋权的K近邻算法需要解决的重要问题之一,传统上提出了许多启发式的学习方法。近年来,随着进化计算技术在模式识别及数据挖掘领域的广泛应用,基于进化计算的权重学习和距离学习方法也得到越来越多的重视。本研究... 特征权重学习是基于特征赋权的K近邻算法需要解决的重要问题之一,传统上提出了许多启发式的学习方法。近年来,随着进化计算技术在模式识别及数据挖掘领域的广泛应用,基于进化计算的权重学习和距离学习方法也得到越来越多的重视。本研究针对基于特征赋权的K近邻算法的权重学习问题,提出了一种基于PSO进行权重学习的算法PSOKNN,通过与传统KNN、GAKNN及ReliefKNN的实验比较分析表明,该方法可有效地搜索出合适的特征权重,获得较好的分类精度并淘汰冗余或无关的特征。 展开更多
关键词 特征赋权 K近邻分类 粒子群算法
下载PDF
基于KNN的特征自适应加权自然图像分类研究 被引量:17
8
作者 侯玉婷 彭进业 +1 位作者 郝露微 王瑞 《计算机应用研究》 CSCD 北大核心 2014年第3期957-960,共4页
针对自然图像类型广泛、结构复杂、分类精度不高的实际问题,提出了一种为自然图像不同特征自动加权值的K-近邻(K-nearest neighbors,KNN)分类方法。通过分析自然图像的不同特征对于分类结果的影响,采用基因遗传算法求得一组最优分类权... 针对自然图像类型广泛、结构复杂、分类精度不高的实际问题,提出了一种为自然图像不同特征自动加权值的K-近邻(K-nearest neighbors,KNN)分类方法。通过分析自然图像的不同特征对于分类结果的影响,采用基因遗传算法求得一组最优分类权值向量解,利用该最优权值对自然图像纹理和颜色两个特征分别进行加权,最后用自适应加权K-近邻算法实现对自然图像的分类。实验结果表明,在用户给定分类精度需求和低时间复杂度的约束下,算法能快速、高精度地进行自然图像分类。提出的自适应加权K-近邻分类方法对于门类繁多的自然图像具有普遍适用性,可以有效地提高自然图像的分类性能。 展开更多
关键词 K-近邻算法 基因算法 自然图像分类 特征加权
下载PDF
一种基于PSO同步进行特征选择及参数优化的核K近邻分类算法 被引量:5
9
作者 任江涛 姚树宇 纪庆革 《小型微型计算机系统》 CSCD 北大核心 2007年第8期1461-1464,共4页
特征选择及分类器参数优化是提高分类器性能的两个重要方面,传统上这两个问题是分开解决的.近年来,随着进化优化计算技术在模式识别领域的广泛应用,编码上的灵活性使得特征选择及参数的同步优化成为一种可能和趋势.为了解决此问题,本文... 特征选择及分类器参数优化是提高分类器性能的两个重要方面,传统上这两个问题是分开解决的.近年来,随着进化优化计算技术在模式识别领域的广泛应用,编码上的灵活性使得特征选择及参数的同步优化成为一种可能和趋势.为了解决此问题,本文研究采用二进制PSO算法进行特征选择及核K近邻分类器参数的同步优化.实验表明,该方法可有效地找出合适的特征子集及核函数参数,并取得较好的分类效果. 展开更多
关键词 特征选择 分类器参数 同步优化 粒子群算法 核K近邻算法
下载PDF
非独立同分布下数值型数据的KNN算法改进 被引量:2
10
作者 孙聪慧 姜合 相益萱 《计算机工程与设计》 北大核心 2021年第10期2816-2822,共7页
为挖掘数据的非独立同分布关系并解决传统KNN算法中存在的分类结果不准确的问题,提出一种非独立同分布下数值型数据的KNN改进算法。利用Pearson相关系数公式得出耦合相似度矩阵,通过该耦合相似度矩阵计算样本的类隶属度,通过ReliefF算... 为挖掘数据的非独立同分布关系并解决传统KNN算法中存在的分类结果不准确的问题,提出一种非独立同分布下数值型数据的KNN改进算法。利用Pearson相关系数公式得出耦合相似度矩阵,通过该耦合相似度矩阵计算样本的类隶属度,通过ReliefF算法思想进行特征权重的计算,根据训练样本的类隶属度和特征权重更新类别决策规则,确定待分类样本的类别。对多个UCI数据集的验证结果表明,该算法能够有效提高分类准确率。 展开更多
关键词 非独立同分布 knn算法 Pearson相关系数 类隶属度 特征权重
下载PDF
基于特征加权的KNNFP改进算法及在故障诊断中的应用 被引量:2
11
作者 赵俊杰 《电子技术应用》 北大核心 2011年第4期113-116,121,共5页
针对传统K最近邻特征投影(KNNFP)算法中假设各维特征对分类的贡献相同而导致分类性能下降的问题,提出一种基于特征加权的KNNFP改进算法(WKNNFP)。改进算法利用ReliefF算法确定特征的权值,使样本的分类效果更好,同时还可以分析各特征对... 针对传统K最近邻特征投影(KNNFP)算法中假设各维特征对分类的贡献相同而导致分类性能下降的问题,提出一种基于特征加权的KNNFP改进算法(WKNNFP)。改进算法利用ReliefF算法确定特征的权值,使样本的分类效果更好,同时还可以分析各特征对分类的贡献程度,并利用改进算法对轴承故障进行诊断。结果表明,改进算法的诊断率优于传统的KNN和KNNFP算法。 展开更多
关键词 K最近邻特征投影 特征加权 K最近邻 故障诊断
下载PDF
基于加权KNN的医院财务信息自动分类系统 被引量:1
12
作者 孙丽娟 徐伟 胡艺宸 《自动化技术与应用》 2022年第11期92-95,111,共5页
针对医院财务信息量大且复杂的特点,传统信息分类系统无法满足信息分类的精度和效率要求,为此提出了基于加权KNN(k-Nearest Neighbor,K最近邻分类算法)的医院财务信息自动分类系统,以提高信息处理能力。通过设计医院财务信息分类的CPU... 针对医院财务信息量大且复杂的特点,传统信息分类系统无法满足信息分类的精度和效率要求,为此提出了基于加权KNN(k-Nearest Neighbor,K最近邻分类算法)的医院财务信息自动分类系统,以提高信息处理能力。通过设计医院财务信息分类的CPU板卡、信息调度器和信息分类控制器,实现对财务信息的分类控制。采用加权KNN算法作为支持向量机的核函数,对财务信息特征进行提取,根据获取的特征结果构建信息分类流程,实现医院财务信息的自动分类。测试结果表明,本文系统CPU使用率只有3%,具有较好的分类性能,在分类效果方面数据丢失较少,有效提升信息分类的精度和效率。 展开更多
关键词 加权knn算法 医院财务 信息分类 支持向量机 特征提取
下载PDF
基于PSO-FWSVM的糖尿病预测模型
13
作者 缪琦 朱玉全 《计算机与数字工程》 2020年第5期993-998,共6页
糖尿病是三大慢性病之一,及早发现有利于对该病进行控制。为了提高早期诊断率,提出基于支持向量机(SVM)建立合适的糖尿病预测模型。在分析糖尿病数据特点基础上,提出对核函数进行加权处理,避免弱相关特征对分类结果的影响,从而提高了分... 糖尿病是三大慢性病之一,及早发现有利于对该病进行控制。为了提高早期诊断率,提出基于支持向量机(SVM)建立合适的糖尿病预测模型。在分析糖尿病数据特点基础上,提出对核函数进行加权处理,避免弱相关特征对分类结果的影响,从而提高了分类模型的识别率。之后采用自适应粒子群优化算法对FWSVM模型进行参数优化,并对某医院的实际糖尿病数据集进行模型的训练和识别。实验结果表明:相对于其他常用模型,论文的模型识别准确率和运算效率都有一定程度的提高,达到90.36%,性能上优于其他几种模型。 展开更多
关键词 糖尿病预测 支持向量机(SVM) 特征加权(FW) 粒子群优化(pso)
下载PDF
一种基于PSO特征加权的局部支持向量机
14
作者 浩庆波 高慧 万曙静 《智能计算机与应用》 2018年第6期61-63,68,共4页
特征权重是指样本特征对分类的重要程度。在分类过程中通常是将样本特征赋予相同的权重。事实上有相当可观的数据特征中存在许多与分类弱相关的特征,赋予相同的权重会降低分类精度。针对上述问题,提出了一种基于PSO特征加权的局部支持... 特征权重是指样本特征对分类的重要程度。在分类过程中通常是将样本特征赋予相同的权重。事实上有相当可观的数据特征中存在许多与分类弱相关的特征,赋予相同的权重会降低分类精度。针对上述问题,提出了一种基于PSO特征加权的局部支持向量机,经UCI数据集测试,结果表明该算法的分类精度优于一般的局部支持向量机。 展开更多
关键词 粒子群 特征权重 局部支持向量机
下载PDF
KNN分类算法改进研究进展 被引量:29
15
作者 奉国和 吴敬学 《图书情报工作》 CSSCI 北大核心 2012年第21期97-100,118,共5页
指出传统KNN(k-nearest neighbor)算法的两大不足:一是计算开销大,分类效率低;二是在进行相似性度量和类别判断时,等同对待各特征项以及近邻样本,影响分类准确程度。针对第一点不足,提出三种改进策略,分别为:基于特征降维的改进、基于... 指出传统KNN(k-nearest neighbor)算法的两大不足:一是计算开销大,分类效率低;二是在进行相似性度量和类别判断时,等同对待各特征项以及近邻样本,影响分类准确程度。针对第一点不足,提出三种改进策略,分别为:基于特征降维的改进、基于训练集的改进和基于近邻搜索方法的改进;针对第二点不足,提出两种改进策略,分别为:基于特征加权的改进和基于类别判断策略的改进。对每种改进策略中的代表方法进行介绍并加以评述。 展开更多
关键词 knn分类 特征降维 特征加权 训练集优化 快速算法
原文传递
融合特征权重与改进粒子群优化的特征选择算法 被引量:3
16
作者 刘振超 苑迎春 +1 位作者 王克俭 何晨 《计算机工程与科学》 CSCD 北大核心 2024年第2期282-291,共10页
随着教育信息化的发展,教育数据呈现特征数量高、冗余度高等特点,这使目前的分类算法在教育数据上分类准确率不理想。提出一种将特征权重算法与改进粒子群优化算法融合的混合式特征选择算法(RF-ATPSO)。该算法首先使用RELIEF-F算法计算... 随着教育信息化的发展,教育数据呈现特征数量高、冗余度高等特点,这使目前的分类算法在教育数据上分类准确率不理想。提出一种将特征权重算法与改进粒子群优化算法融合的混合式特征选择算法(RF-ATPSO)。该算法首先使用RELIEF-F算法计算各个特征的权重,筛除冗余特征,然后在筛选后的特征集合中利用改进粒子群算法搜索最优特征子集。实验结果表明,在6个UCI公共数据集上,经RF-ATPSO算法进行特征选择后,平均准确率提升了10.04%,且平均特征子集规模最小、收敛速度最快;在学生学业成绩画像特征数据集上,该算法以较小的特征子集规模达到较高的分类准确率,平均准确率为94.77%,明显优于其它特征选择算法,实验充分证明了该算法具有实际应用意义。 展开更多
关键词 特征选择 特征权重 改进粒子群优化 T-分布
下载PDF
一种新的基于统计的自动文本分类方法 被引量:48
17
作者 刘斌 黄铁军 +1 位作者 程军 高文 《中文信息学报》 CSCD 北大核心 2002年第6期18-24,共7页
自动文本分类就是在给定的分类体系下 ,让计算机根据文本的内容确定与它相关联的类别。为了提高分类性能 ,本文提出了中文文本多层次特征提取方法和基于核的距离加权KNN算法。多层次特征提取方法在汉字、常用词表和专业词表三个层次上... 自动文本分类就是在给定的分类体系下 ,让计算机根据文本的内容确定与它相关联的类别。为了提高分类性能 ,本文提出了中文文本多层次特征提取方法和基于核的距离加权KNN算法。多层次特征提取方法在汉字、常用词表和专业词表三个层次上提取文档的统计特征 ,能够更好地反映文档的统计分布。基于核的距离加权KNN算法解决了样本的多峰分布、边界重叠问题和分类器的精确分类决策问题。实际应用中 ,互联网和文本库提供了大量经过粗分类的训练文本 ,但普遍存在样本质量较差的问题 ,本文通过样本重要性分析技术解决此问题。实验系统证明了新方法的有效性。 展开更多
关键词 统计 自动文本分类 多层次特征提取 距离加权knn算法 样本重要性分析 汉字识别
下载PDF
基于电—振信号熵权特征的断路器储能机构故障诊断方法 被引量:11
18
作者 赵书涛 李云鹏 +3 位作者 王二旭 朱继鹏 马莉 王科登 《高压电器》 CAS CSCD 北大核心 2019年第11期204-210,共7页
弹簧势能的可靠储存是保障断路器后续分合闸操作正确的前提。通过分析控制回路、电机、传动部件和弹簧之间的能量转换和传递关系,提出一种电-振信号熵权特征联合的断路器储能机构故障类型辨识方法。首先利用希尔伯特变换(Hilbert transf... 弹簧势能的可靠储存是保障断路器后续分合闸操作正确的前提。通过分析控制回路、电机、传动部件和弹簧之间的能量转换和传递关系,提出一种电-振信号熵权特征联合的断路器储能机构故障类型辨识方法。首先利用希尔伯特变换(Hilbert transform)提取储能电机电流信号包络时域特征并计算峭度;然后由局部均值分解(LMD)处理断路器储能过程伴随的振动信号得到乘积函数分量(PF),并提取PF能量谱频域的盒维数特征;进而采用熵权法对电流和振动信号待分类样本进行剪辑,按照样本信息量和重要性赋予对应的权重;最后把熵权特征作为KNN算法的输入,辨识储能机构运行状态。实验结果表明:采用联合电-振信号的熵权特征量,KNN算法能更准确地诊断断路器储能机构发生的故障类型。 展开更多
关键词 熵权特征 局部均值分解 盒维数 联合诊断 knn算法
下载PDF
中文网页分类的研究与实现 被引量:13
19
作者 程传鹏 《中原工学院学报》 CAS 2007年第1期61-64,共4页
描述了一个完整的中文网页分类系统的设计和实现过程,重点介绍了网页分类中的网页净化、特征加权、KNN分类等关键技术.并结合网页的特征,对分类中的特征加权公式进行了一定的改进.实验结果表明改进后的特征加权公式取得了较高的分类准确率.
关键词 网页分类 网页净化 特征加权 knn分类
下载PDF
粒子群选择特征和信息增益确定特征权值的入侵检测 被引量:8
20
作者 黄会群 孙虹 《计算机应用》 CSCD 北大核心 2014年第6期1686-1688,1693,共4页
为了提高网络入侵检测正确率,提出一种粒子群算法(PSO)选择特征和信息增益(IG)法确定特征权值的网络入侵检测模型(PSO-IG)。首先采用PSO选择网络入侵特征子集,消除冗余特征;然后采用IG法确定特征子集中的特征权重,并采用支持向量机(SVM... 为了提高网络入侵检测正确率,提出一种粒子群算法(PSO)选择特征和信息增益(IG)法确定特征权值的网络入侵检测模型(PSO-IG)。首先采用PSO选择网络入侵特征子集,消除冗余特征;然后采用IG法确定特征子集中的特征权重,并采用支持向量机(SVM)建立分类模型;最后采用KDD CUP 99数据集对PSO-IG的性能进行测试。测试结果表明:PSO-IG消除了冗余特征,降低了输入维数,提高了网络入侵检测速度;通过合理确定特征权值,提高了入侵检测正确率。 展开更多
关键词 特征选择 特征权值 入侵检测 粒子群算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部