期刊文献+
共找到410篇文章
< 1 2 21 >
每页显示 20 50 100
基于K-Medoids聚类的改进KNN文本分类算法 被引量:25
1
作者 罗贤锋 祝胜林 +1 位作者 陈泽健 袁玉强 《计算机工程与设计》 CSCD 北大核心 2014年第11期3864-3867,3937,共5页
为有效提高传统KNN算法(K最近邻算法)在海量数据的分类效率,分析传统KNN算法的分类过程,提出基于K-Medoids聚类的改进KNN算法。利用K-Medoids算法对文本训练集进行聚类,把文本训练集分成相似度较高的簇;根据待分类文本与簇的相对位置,... 为有效提高传统KNN算法(K最近邻算法)在海量数据的分类效率,分析传统KNN算法的分类过程,提出基于K-Medoids聚类的改进KNN算法。利用K-Medoids算法对文本训练集进行聚类,把文本训练集分成相似度较高的簇;根据待分类文本与簇的相对位置,对文本训练集进行裁剪,解决传统KNN算法在文本训练集过大时速度慢的问题。分析与实验结果表明,该裁剪方法能够合理有效地裁剪文本训练集,提高了KNN算法的运行效率和分类能力。 展开更多
关键词 文本分类 隶属度 K最近邻 样本裁剪 k-Medoids聚类
下载PDF
Kernel-kNN:基于信息能度量的核k-最近邻算法 被引量:15
2
作者 刘松华 张军英 +1 位作者 许进 贾宏恩 《自动化学报》 EI CSCD 北大核心 2010年第12期1681-1688,共8页
提出一种核k最近邻算法.首先给出用于最近邻学习的信息能度量方法,该方法克服了高维数据不便于用传统距离度量表示的困难,提高了数据间类别相似性和距离的一致性.在此基础上,将传统的kNN扩展为非线性形式,并采用半正定规划学习全局最优... 提出一种核k最近邻算法.首先给出用于最近邻学习的信息能度量方法,该方法克服了高维数据不便于用传统距离度量表示的困难,提高了数据间类别相似性和距离的一致性.在此基础上,将传统的kNN扩展为非线性形式,并采用半正定规划学习全局最优的度量矩阵.算法主要特点是:能较好地适用于高维数据,并有效提升kNN的分类性能.多个数据集的实验和分析表明,本文的Kernel-kNN算法与传统的kNN算法比较,在低维数据上,分类准确率相当;在高维数据上,分类性能有明显提高. 展开更多
关键词 距离度量 非线性变换 k-最近邻(k-NN) 核方法
下载PDF
基于k-最近邻图的小样本KNN分类算法 被引量:27
3
作者 刘应东 牛惠民 《计算机工程》 CAS CSCD 北大核心 2011年第9期198-200,共3页
提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对... 提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对象进行类别标识。采用标准数据集进行测试,结果表明该算法在小样本情况下能够提高KNN的分类精度,减小最近邻阈值k对分类效果的影响。 展开更多
关键词 knn算法 k-最近邻图 小样本 图划分 分类算法
下载PDF
水声目标识别中的K-D树KNN-SVM分类器研究 被引量:2
4
作者 黄杰 朱广平 《海洋技术学报》 2018年第1期15-22,共8页
常规的KNN-SVM联合分类器中K-近邻算法没有充分挖掘训练样本的信息,使用遍历的方法来计算待识别样本与训练样本之间的距离,特别是在训练样本巨大时,存在大量的冗余计算。针对该问题,将训练样本训练成K-D树的结构,设计了K-D树KNN-SVM分类... 常规的KNN-SVM联合分类器中K-近邻算法没有充分挖掘训练样本的信息,使用遍历的方法来计算待识别样本与训练样本之间的距离,特别是在训练样本巨大时,存在大量的冗余计算。针对该问题,将训练样本训练成K-D树的结构,设计了K-D树KNN-SVM分类器,该分类器可以大大减少这些多余的计算,从而提高了搜索效率,有效缩短了搜索时间。进行了仿真和实验研究,分别设计了KNN、SVM、KNN-SVM分类器对两类水下目标进行了分类识别,并对相关参数的选取进行了优化。实验结果表明:在选定了最佳参数后的KNN-SVM联合分类器较其它两类分类器在识别率和识别效率方面都是最佳的;采用了K-D树结构的KNN-SVM联合分类器中KNN部分识别效率要比常规的高约7.5倍。 展开更多
关键词 水下目标识别 支持向量机(SVM) K近邻(knn) k-D树 knn—SVM联合分类器
下载PDF
基于密文KNN检索的室内定位隐私保护算法 被引量:2
5
作者 欧锦添 乐燕芬 施伟斌 《数据采集与处理》 CSCD 北大核心 2024年第2期456-470,共15页
在定位请求服务中,如何保护用户的位置隐私和位置服务提供商(Localization service provider,LSP)的数据隐私是关系到WiFi指纹定位应用的一个具有挑战性的问题。基于密文域的K-近邻(K-nearest neighbors,KNN)检索,本文提出了一种适用于... 在定位请求服务中,如何保护用户的位置隐私和位置服务提供商(Localization service provider,LSP)的数据隐私是关系到WiFi指纹定位应用的一个具有挑战性的问题。基于密文域的K-近邻(K-nearest neighbors,KNN)检索,本文提出了一种适用于三方的定位隐私保护算法,能有效提升对LSP指纹信息隐私的保护强度并降低计算开销。服务器和用户分别完成对指纹信息和定位请求的加密,而第三方则基于加密指纹库和加密定位请求,在隐私状态下完成对用户的位置估计。所提算法把各参考点的位置信息随机嵌入指纹,可避免恶意用户获取各参考点的具体位置;进一步利用布隆滤波器在隐藏接入点信息的情况下,第三方可完成参考点的在线匹配,实现对用户隐私状态下的粗定位,可与定位算法结合降低计算开销。在公共数据集和实验室数据集中,对两种算法的安全、开销和定位性能进行了全面的评估。与同类加密算法比较,在不降低定位精度的情况下,进一步增强了对数据隐私的保护。 展开更多
关键词 隐私保护 指纹定位 密文k-近邻检索 布隆滤波器 WIFI
下载PDF
FEW-NNN: A Fuzzy Entropy Weighted Natural Nearest Neighbor Method for Flow-Based Network Traffic Attack Detection 被引量:7
6
作者 Liangchen Chen Shu Gao +2 位作者 Baoxu Liu Zhigang Lu Zhengwei Jiang 《China Communications》 SCIE CSCD 2020年第5期151-167,共17页
Attacks such as APT usually hide communication data in massive legitimate network traffic, and mining structurally complex and latent relationships among flow-based network traffic to detect attacks has become the foc... Attacks such as APT usually hide communication data in massive legitimate network traffic, and mining structurally complex and latent relationships among flow-based network traffic to detect attacks has become the focus of many initiatives. Effectively analyzing massive network security data with high dimensions for suspicious flow diagnosis is a huge challenge. In addition, the uneven distribution of network traffic does not fully reflect the differences of class sample features, resulting in the low accuracy of attack detection. To solve these problems, a novel approach called the fuzzy entropy weighted natural nearest neighbor(FEW-NNN) method is proposed to enhance the accuracy and efficiency of flowbased network traffic attack detection. First, the FEW-NNN method uses the Fisher score and deep graph feature learning algorithm to remove unimportant features and reduce the data dimension. Then, according to the proposed natural nearest neighbor searching algorithm(NNN_Searching), the density of data points, each class center and the smallest enclosing sphere radius are determined correspondingly. Finally, a fuzzy entropy weighted KNN classification method based on affinity is proposed, which mainly includes the following three steps: 1、 the feature weights of samples are calculated based on fuzzy entropy values, 2、 the fuzzy memberships of samples are determined based on affinity among samples, and 3、 K-neighbors are selected according to the class-conditional weighted Euclidean distance, the fuzzy membership value of the testing sample is calculated based on the membership of k-neighbors, and then all testing samples are classified according to the fuzzy membership value of the samples belonging to each class;that is, the attack type is determined. The method has been applied to the problem of attack detection and validated based on the famous KDD99 and CICIDS-2017 datasets. From the experimental results shown in this paper, it is observed that the FEW-NNN method improves the accuracy and efficiency of flow-based network traffic attack detection. 展开更多
关键词 fuzzy entropy weighted knn network attack detection fuzzy membership natural nearest neighbor network security intrusion detection system
下载PDF
The k Nearest Neighbors Estimator of the M-Regression in Functional Statistics 被引量:4
7
作者 Ahmed Bachir Ibrahim Mufrah Almanjahie Mohammed Kadi Attouch 《Computers, Materials & Continua》 SCIE EI 2020年第12期2049-2064,共16页
It is well known that the nonparametric estimation of the regression function is highly sensitive to the presence of even a small proportion of outliers in the data.To solve the problem of typical observations when th... It is well known that the nonparametric estimation of the regression function is highly sensitive to the presence of even a small proportion of outliers in the data.To solve the problem of typical observations when the covariates of the nonparametric component are functional,the robust estimates for the regression parameter and regression operator are introduced.The main propose of the paper is to consider data-driven methods of selecting the number of neighbors in order to make the proposed processes fully automatic.We use thek Nearest Neighbors procedure(kNN)to construct the kernel estimator of the proposed robust model.Under some regularity conditions,we state consistency results for kNN functional estimators,which are uniform in the number of neighbors(UINN).Furthermore,a simulation study and an empirical application to a real data analysis of octane gasoline predictions are carried out to illustrate the higher predictive performances and the usefulness of the kNN approach. 展开更多
关键词 Functional data analysis quantile regression knn method uniform nearest neighbor(UNN)consistency functional nonparametric statistics almost complete convergence rate
下载PDF
基于K-近邻与FOA改进聚类的数据异常分析模型及用电行为分析
8
作者 周伟 牛誉蓉 《成都工业学院学报》 2024年第5期11-16,共6页
对隐藏在大数据中的信息进行深层挖掘时,由于存在数据来源、统计口径、人员输入、行为异常等方面的问题,可能出现异常数据。针对此类问题,首先利用离散小波变换进行多尺度分解,然后采用K-近邻思想对局部区域的密度、距离重新定义,来提... 对隐藏在大数据中的信息进行深层挖掘时,由于存在数据来源、统计口径、人员输入、行为异常等方面的问题,可能出现异常数据。针对此类问题,首先利用离散小波变换进行多尺度分解,然后采用K-近邻思想对局部区域的密度、距离重新定义,来提高对异常值的识别精度;最后结合改进的果蝇优化算法,对密度峰值聚类算法中的截断距离进行优化,提出基于K-近邻与改进果蝇优化的密度峰值聚类异常分析模型。从异常值检测角度进行仿真实验分析,根据用户数据多时间尺度特征,对不同时间尺度的复合数据进行聚类,对用电行为进行分析;选择多种标准测试函数,对基于知识学习的改进果蝇优化算法性能进行对比研究。结果显示,基于K-近邻的算法能够将变压器中不同于正常运行模式的少数异常曲线及单个用户的异常用电模式检测出来,其有效性得到了验证。在基于知识学习的改进果蝇优化算法中,随着果蝇个体数量增加其寻优能力也得到提高。 展开更多
关键词 异常值检测 果蝇优化算法 k-近邻算法 峰值聚类算法 用电行为
下载PDF
基于KNN算法的教学质量评价模型建立
9
作者 张晓东 张晓晓 《宁德师范学院学报(自然科学版)》 2024年第3期324-329,共6页
针对当前教学质量评价存在主观性较强的不足,基于K-最近邻(K-nearest neighbor,KNN)算法,提出教学质量评价模型.确立教学质量评价体系;以教学督导的评价数据为样本数据,通过交叉验证求解最近邻算法参数K的最佳值,从而建立教学质量评价模... 针对当前教学质量评价存在主观性较强的不足,基于K-最近邻(K-nearest neighbor,KNN)算法,提出教学质量评价模型.确立教学质量评价体系;以教学督导的评价数据为样本数据,通过交叉验证求解最近邻算法参数K的最佳值,从而建立教学质量评价模型.模型以专家数据为样本,评价精度高,评价结果具有较高的可靠性,能根据相关指标快速产生评价等级,提高了教学质量评价效率,使教学质量评价更加客观全面. 展开更多
关键词 教学质量评价 k-最近邻(knn)算法 交叉验证
下载PDF
基于CK-Hough联合算法的人体微多普勒频率估计
10
作者 陈雨馨 彭意群 +1 位作者 柳润金 丁一鹏 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第9期3329-3341,共13页
为了准确地从雷达回波信号中提取运动目标特定部位的微多普勒频率,本文提出一种新颖的CKHough算法,该算法有效地结合了聚类分析和K近邻-霍夫(KNN-Hough)算法。首先,通过短时傅里叶变换获取雷达回波信号的时频谱图;其次,利用自适应模糊C... 为了准确地从雷达回波信号中提取运动目标特定部位的微多普勒频率,本文提出一种新颖的CKHough算法,该算法有效地结合了聚类分析和K近邻-霍夫(KNN-Hough)算法。首先,通过短时傅里叶变换获取雷达回波信号的时频谱图;其次,利用自适应模糊C均值算法对时频图进行聚类分析,在这一过程中,本文采用数据预处理技术自适应调整聚类类别数c以适应多样化应用场景,从而获得人体各散射部位的频域范围,有效地抑制了分量间的相互干扰;第三,通过改进度量函数的K近邻算法增强相邻时刻聚类结果的相关性,拟合各部位的瞬时频率曲线;最后,采用霍夫变换动态调整度量函数中权值μ的取值,得到目标微多普勒频率的精确估计结果。研究结果表明:本文提出的CK-Hough提取了直/曲线行走场景下人类目标四肢的微多普勒频率;与传统的峰值搜索算法、线性预测维特比算法以及基于Bezier-Hough模型的频率拟合算法相比,本文提出的CK-Hough算法在直线行走实验场景下,总频率的估计误差率分别降低了40.40%、45.47%和26.16%;在曲线行走实验场景下,其估计误差率分别降低了58.35%、68.35%和41.65%。 展开更多
关键词 微多普勒频率提取 时频分析 自适应模糊C均值聚类 K近邻 霍夫变换
下载PDF
基于PCA-BOA-KNN模型的水下爆炸舰船结构破损评估
11
作者 梁潇帝 刘寅东 《中国舰船研究》 CSCD 北大核心 2024年第3期150-157,共8页
[目的]为解决水下爆炸作用下舰船结构破口损伤评估问题,建立一种基于PCA-BOA-KNN模型的破口预报方法。[方法]首先,分别建立五舱段和七舱段有限元模型,对21组水下爆炸工况进行爆炸仿真分析;然后,基于主成分分析(PCA)法,对加速度峰值、速... [目的]为解决水下爆炸作用下舰船结构破口损伤评估问题,建立一种基于PCA-BOA-KNN模型的破口预报方法。[方法]首先,分别建立五舱段和七舱段有限元模型,对21组水下爆炸工况进行爆炸仿真分析;然后,基于主成分分析(PCA)法,对加速度峰值、速度峰值、位移峰值、应力峰值和超压峰值进行降维处理,得到2个本征特征量;最后,将由主成分分析法得到的结果代入贝叶斯网络优化(BOA)的KNN模型,通过建立的破口预报模型,预测一组工况下舰船不同剖面处的破口情况。[结果]结果显示,通过主成分分析法提取的前2个因子的累计贡献率为85.165%,这2个因子可代表5个特征量的主要信息;基于PCA-BOAKNN模型的破口预报结果与仿真结果基本一致。[结论]所提的预报模型方法对舰船结构破口预报有效,对于不同主尺度船体结构破口预报有一定的参考价值。 展开更多
关键词 结构分析 主成分分析 knn算法 水下爆炸
下载PDF
KNN数据挖掘算法在北京地区霾等级预报中的应用 被引量:53
12
作者 熊亚军 廖晓农 +6 位作者 李梓铭 张小玲 孙兆彬 赵秀娟 赵普生 马小会 蒲维维 《气象》 CSCD 北大核心 2015年第1期98-104,共7页
利用北京地区2013年气象数据以及PM_(2.5)浓度数据与能见度数据进行对比分析,结果发现气温、气压、相对湿度、露点温度、地面U风、地面V风以及PM_(2.5)小时浓度这7个要素是影响北京地区霾等级的关键因素。利用气温、地面气压、相对湿度... 利用北京地区2013年气象数据以及PM_(2.5)浓度数据与能见度数据进行对比分析,结果发现气温、气压、相对湿度、露点温度、地面U风、地面V风以及PM_(2.5)小时浓度这7个要素是影响北京地区霾等级的关键因素。利用气温、地面气压、相对湿度、露点温度、U风、V风分量以及PM_(2.5)浓度作为7个属性特征,以霾等级做为标志量构建训练样本集,结合KNN(KNearest Neighbor)数据挖掘算法构建疆等级预报分类器,并开展霾等级客观识别实验。结果表明K=3时该分类器的分类预报效果最佳,其13个站点的分类准确率高达88.2%。基于该算法构建的KNN模型预报无霾时的漏报概率很小,准确率高达91.8%;预报有轻度霾、中度霾以及重度霾时,空报的概率仅分别为4.7%、1.4%和2.6%。2014年8月29日至9月2日北京地区一次霾天气过程的预报结果表明:南郊观象台、密云和延庆3站的预报准确率分别达到74%、64%和84%,但霾等级的精度方面还有待于进一步提高。 展开更多
关键词 数据挖掘 knn 预报
下载PDF
改进型加权KNN算法的不平衡数据集分类 被引量:26
13
作者 王超学 潘正茂 +2 位作者 马春森 董丽丽 张涛 《计算机工程》 CAS CSCD 2012年第20期160-163,168,共5页
K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚... K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚类,按照权重分配模型计算各训练样本的权重,通过改进的KNN算法对测试样本进行分类。基于UCI数据集的大量实验结果表明,GAK-KNN算法的识别率和整体性能都优于传统KNN算法及其他改进算法。 展开更多
关键词 不平衡数据集 分类 K最邻近算法 权重分配模型 遗传算法 k-MEANS算法
下载PDF
基于Spark框架的高效KNN中文文本分类算法 被引量:19
14
作者 于苹苹 倪建成 +2 位作者 姚彬修 李淋淋 曹博 《计算机应用》 CSCD 北大核心 2016年第12期3292-3297,共6页
针对K-最近邻(KNN)分类算法时间复杂度与训练样本数量成正比而导致的计算量大的问题以及当前大数据背景下面临的传统架构处理速度慢的问题,提出了一种基于Spark框架与聚类优化的高效KNN分类算法。该算法首先利用引入收缩因子的优化K-... 针对K-最近邻(KNN)分类算法时间复杂度与训练样本数量成正比而导致的计算量大的问题以及当前大数据背景下面临的传统架构处理速度慢的问题,提出了一种基于Spark框架与聚类优化的高效KNN分类算法。该算法首先利用引入收缩因子的优化K-medoids聚类算法对训练集进行两次裁剪;然后在分类过程中迭代K值获得分类结果,并在计算过程中结合Spark计算框架对数据进行分区迭代实现并行化。实验结果表明,在不同数据集中传统尽最近邻算法、基于K-medoids的群最近邻算法所耗费时间是所提Spark框架下的B最近邻算法的3.92-31.90倍,所提算法具有较高的计算效率,相较于Hadoop平台有较好的加速比,可有效地对大数据进行分类处理。 展开更多
关键词 k-最近邻 聚类 收缩因子 k-medoids SPARK 并行化计算
下载PDF
基于等距映射与加权KNN的旋转机械故障诊断 被引量:38
15
作者 陈法法 汤宝平 苏祖强 《仪器仪表学报》 EI CAS CSCD 北大核心 2013年第1期215-220,共6页
针对旋转机械高维复杂故障特征数据难以快速准确辨识的问题,提出一种基于等距映射非线性流形学习与加权KNN(K-nearest neighbor)分类器相结合的旋转机械故障诊断方法。在由时域统计指标和内禀模态分量能量构造的原始特征空间中,首先利... 针对旋转机械高维复杂故障特征数据难以快速准确辨识的问题,提出一种基于等距映射非线性流形学习与加权KNN(K-nearest neighbor)分类器相结合的旋转机械故障诊断方法。在由时域统计指标和内禀模态分量能量构造的原始特征空间中,首先利用等距映射非线性流形学习算法提取旋转机械故障状态变化的本质特征,随后将提取的低维本质特征输入给加权KNN进行旋转机械的故障模式辨识。通过对齿轮箱的实验数据分析表明,该方法不仅对高维复杂的非线性故障特征具有良好的降维性能,而且故障识别率较之传统方法也明显提高,能够有效识别出高维特征空间的非线性故障特征。 展开更多
关键词 流形学习 等距映射 加权K近邻 旋转机械 故障诊断
下载PDF
大数据下的快速KNN分类算法 被引量:29
16
作者 苏毅娟 邓振云 +1 位作者 程德波 宗鸣 《计算机应用研究》 CSCD 北大核心 2016年第4期1003-1006,1023,共5页
针对K最近邻算法测试复杂度至少为线性,导致其在大数据样本情况下的效率很低的问题,提出了一种应用于大数据下的快速KNN分类算法。该算法创新性地在K最近邻算法中引入训练过程,即通过线性复杂度聚类方法对大数据样本进行分块,然后在测... 针对K最近邻算法测试复杂度至少为线性,导致其在大数据样本情况下的效率很低的问题,提出了一种应用于大数据下的快速KNN分类算法。该算法创新性地在K最近邻算法中引入训练过程,即通过线性复杂度聚类方法对大数据样本进行分块,然后在测试过程中找出与待测样本距离最近的块,并将其作为新的训练样本进行K最近邻分类。这样的过程大幅度地减少了K最近邻算法的测试开销,使其能在大数据集中得以应用。实验表明,该算法在与经典KNN分类准确率保持近似的情况下,分类的速度明显快于经典KNN算法。 展开更多
关键词 K最近邻 测试复杂度 大数据 分块 聚类中心
下载PDF
基于粗糙集的快速KNN文本分类算法 被引量:22
17
作者 孙荣宗 苗夺谦 +1 位作者 卫志华 李文 《计算机工程》 CAS CSCD 北大核心 2010年第24期175-177,共3页
传统K最近邻一个明显缺陷是样本相似度的计算量很大,在具有大量高维样本的文本分类中,由于复杂度太高而缺乏实用性。为此,将粗糙集理论引入到文本分类中,利用上下近似概念刻画各类训练样本的分布,并在训练过程中计算出各类上下近似的范... 传统K最近邻一个明显缺陷是样本相似度的计算量很大,在具有大量高维样本的文本分类中,由于复杂度太高而缺乏实用性。为此,将粗糙集理论引入到文本分类中,利用上下近似概念刻画各类训练样本的分布,并在训练过程中计算出各类上下近似的范围。在分类过程中根据待分类文本向量在样本空间中的分布位置,改进算法可以直接判定一些文本的归属,缩小K最近邻搜索范围。实验表明,该算法可以在保持K最近邻分类性能基本不变的情况下,显著提高分类效率。 展开更多
关键词 文本分类 K最近邻 粗糙集
下载PDF
基于KNN的特征自适应加权自然图像分类研究 被引量:17
18
作者 侯玉婷 彭进业 +1 位作者 郝露微 王瑞 《计算机应用研究》 CSCD 北大核心 2014年第3期957-960,共4页
针对自然图像类型广泛、结构复杂、分类精度不高的实际问题,提出了一种为自然图像不同特征自动加权值的K-近邻(K-nearest neighbors,KNN)分类方法。通过分析自然图像的不同特征对于分类结果的影响,采用基因遗传算法求得一组最优分类权... 针对自然图像类型广泛、结构复杂、分类精度不高的实际问题,提出了一种为自然图像不同特征自动加权值的K-近邻(K-nearest neighbors,KNN)分类方法。通过分析自然图像的不同特征对于分类结果的影响,采用基因遗传算法求得一组最优分类权值向量解,利用该最优权值对自然图像纹理和颜色两个特征分别进行加权,最后用自适应加权K-近邻算法实现对自然图像的分类。实验结果表明,在用户给定分类精度需求和低时间复杂度的约束下,算法能快速、高精度地进行自然图像分类。提出的自适应加权K-近邻分类方法对于门类繁多的自然图像具有普遍适用性,可以有效地提高自然图像的分类性能。 展开更多
关键词 k-近邻算法 基因算法 自然图像分类 特征加权
下载PDF
基于局部切空间排列和K-最近邻分类器的转子故障诊断方法 被引量:16
19
作者 孙斌 刘立远 牛翀 《中国机械工程》 EI CAS CSCD 北大核心 2015年第1期74-78,共5页
为了解决大型机械设备故障数据难以准确快速提取的问题,提出了一种基于局部切空间排列(LTSA)和K-最近邻分类器的转子故障诊断模型。首先基于转子的振动信号构造一个高维多征兆矩阵,利用LTSA提取高维矩阵的低维特征向量,映射在可视空间里... 为了解决大型机械设备故障数据难以准确快速提取的问题,提出了一种基于局部切空间排列(LTSA)和K-最近邻分类器的转子故障诊断模型。首先基于转子的振动信号构造一个高维多征兆矩阵,利用LTSA提取高维矩阵的低维特征向量,映射在可视空间里;然后将提取的低维特征向量输入K-最近邻分类器进行故障模式识别。试验和数据降维仿真过程表明,该模型的准确度和快速性均优于LTSA和神经网络以及LTSA和支持向量机组成的故障诊断模型。 展开更多
关键词 局部切空间排列 k-最近邻分类器 模式识别 故障诊断
下载PDF
基于密度的kNN分类器训练样本裁剪方法的改进 被引量:13
20
作者 熊忠阳 杨营辉 张玉芳 《计算机应用》 CSCD 北大核心 2010年第3期799-801,817,共4页
在文本分类中,训练集的分布状态会直接影响k-近邻(kNN)分类器的效率和准确率。通过分析基于密度的kNN文本分类器训练样本的裁剪方法,发现它存在两大不足:一是裁剪之后的均匀状态只是以ε为半径的球形区域意义上的均匀状态,而非最理想的... 在文本分类中,训练集的分布状态会直接影响k-近邻(kNN)分类器的效率和准确率。通过分析基于密度的kNN文本分类器训练样本的裁剪方法,发现它存在两大不足:一是裁剪之后的均匀状态只是以ε为半径的球形区域意义上的均匀状态,而非最理想的均匀状态即两两样本之间的距离相等;二是未对低密度区域的样本做任何处理,裁剪之后仍存在大量不均匀的区域。针对这两处不足,提出了以下两点改进:一是优化了裁剪策略,使裁剪之后的训练集更趋于理想的均匀状态;二是实现了对低密度区域样本的补充。通过实验对比,改进后的方法在稳定性和准确率方面都有明显提高。 展开更多
关键词 文本分类 k-近邻 快速分类 样本裁剪 样本补充
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部