期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于改进K最近邻分类算法的不良网页并行识别 被引量:6
1
作者 徐雅斌 李卓 陈俊伊 《计算机应用》 CSCD 北大核心 2013年第12期3368-3371,3379,共5页
互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处... 互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处理。对比实验结果表明,所采用的识别方法的识别准确率和识别效率都有较大的提高。 展开更多
关键词 不良网页 文本分类 k最近邻分类算法 HADOOP MAPREDUCE
下载PDF
基于Hubness与类加权的k最近邻分类算法 被引量:6
2
作者 李金孟 林亚平 祝团飞 《计算机工程》 CAS CSCD 北大核心 2018年第4期248-252,261,共6页
针对高维不平衡数据中维数灾难和类不平衡分布问题,提出一种改进k最近邻(kNN)分类算法HWNN。将样本的k发生分布作为其在预测时对各个类的支持度,以此减少高维数据中hubs对kNN分类带来的潜在负面影响。通过类加权的方式增加少数类在所有... 针对高维不平衡数据中维数灾难和类不平衡分布问题,提出一种改进k最近邻(kNN)分类算法HWNN。将样本的k发生分布作为其在预测时对各个类的支持度,以此减少高维数据中hubs对kNN分类带来的潜在负面影响。通过类加权的方式增加少数类在所有样本k发生中的分布比例,以提升对少数类样本的预测精度。在16个不平衡UCI数据集上的实验结果表明,该算法在高维不平衡数据中的分类结果优于典型kNN方法,且在普通维度的不平衡数据中优势同样明显。 展开更多
关键词 Hubness现象 高维不平衡数据 维数灾难 数据分类 k发生 k最近邻分类
下载PDF
一种基于最短距离聚类的K最近邻分类算法 被引量:1
3
作者 陈江丽 张嵘 《新乡学院学报》 2014年第12期29-33,共5页
针对传统K最近邻(KNN)分类法执行效率低的问题,提出一种改进的K最近邻分类法。先采用最短距离聚类法分别对训练样本和测试样本进行聚类,生成一些小簇和孤立点,再对小簇或孤立点使用改进的K最近邻方法进行分类。改进后的方法能极大地缩... 针对传统K最近邻(KNN)分类法执行效率低的问题,提出一种改进的K最近邻分类法。先采用最短距离聚类法分别对训练样本和测试样本进行聚类,生成一些小簇和孤立点,再对小簇或孤立点使用改进的K最近邻方法进行分类。改进后的方法能极大地缩小分类样本的规模,降低计算成本,提高分类效率。 展开更多
关键词 k最近邻分类 训练样本 测试样本 聚类 最短距离
下载PDF
基于近邻卷积神经网络的油画分类方法研究
4
作者 钱华 祁枢杰 +2 位作者 顾涔 陶然 吴宏杰 《苏州科技大学学报(自然科学版)》 CAS 2024年第1期69-75,共7页
油画分类是油画生成、油画识别及数字油画应用的重要基础工作。但由于油画图片与普通图片存在较大的质感差异,而且是油画家的个性化创作,不确定性更高,较普通照片的分类更困难。论文以分类出含有桥梁的油画为例,提出一种基于近邻卷积神... 油画分类是油画生成、油画识别及数字油画应用的重要基础工作。但由于油画图片与普通图片存在较大的质感差异,而且是油画家的个性化创作,不确定性更高,较普通照片的分类更困难。论文以分类出含有桥梁的油画为例,提出一种基于近邻卷积神经网络的油画分类方法,利用K最近邻分类算法提取与测试样本最接近的K个训练样本,卷积神经网络挖掘油画中的深层特征,从而对油画中的对象进行分类。论文详细讨论了数据处理、卷积神经网络的架构设计、训练过程。并在kaggle数据集上对该方法进行了分析与比较,使用三个数据集进行实验,实验结果表明该方法较最近邻算法精度上平均提高了2.4%,较卷积神经网络精度上平均提高了3.1%,较支持向量机方法精度上平均提高了6.9%。 展开更多
关键词 卷积神经网络 k最近邻分类算法 数据可视化 图像分类
下载PDF
基于改进的K最近邻分类器的风机故障诊断 被引量:1
5
作者 吴斌 奚立峰 +1 位作者 范思遐 王加祥 《机械设计与研究》 CSCD 北大核心 2016年第5期163-167,174,共6页
为提高风机故障的预警诊断准确度,提出了一种基于改进的K最近邻分类器的故障诊断方法。通过引入核函数主元分析,计算各特征向量的贡献度,对欧式距离进行加权,弥补传统K最近邻分类器同贡献权重分配的缺陷。样本训练时,依据各特征向量的... 为提高风机故障的预警诊断准确度,提出了一种基于改进的K最近邻分类器的故障诊断方法。通过引入核函数主元分析,计算各特征向量的贡献度,对欧式距离进行加权,弥补传统K最近邻分类器同贡献权重分配的缺陷。样本训练时,依据各特征向量的贡献数值分配权重。该方法被用于风机故障诊断。实验结果表明该方法增强了诊断准确度,便于工程应用。 展开更多
关键词 风机 改进的k最近邻分类 核主元分析 故障诊断
原文传递
基于k-最近邻分类增强学习的除冰机器人抓线控制 被引量:8
6
作者 魏书宁 王耀南 +1 位作者 印峰 杨易旻 《控制理论与应用》 EI CAS CSCD 北大核心 2012年第4期470-476,共7页
输电线柔性结构特性给除冰机器人越障抓线控制带来极大困难.本文提出了一种结合k–最近邻(k-nearest neighbor,KNN)分类算法和增强学习算法的抓线控制方法.利用基于KNN算法的状态感知机制选择机器人当前状态k个最邻近状态并且对之加权.... 输电线柔性结构特性给除冰机器人越障抓线控制带来极大困难.本文提出了一种结合k–最近邻(k-nearest neighbor,KNN)分类算法和增强学习算法的抓线控制方法.利用基于KNN算法的状态感知机制选择机器人当前状态k个最邻近状态并且对之加权.根据加权结果决定当前最优动作.该方法可以得到机器人连续状态的离散表达形式,从而有效解决传统连续状态泛化方法带来的计算收敛性和维数灾难问题.借助增强学习算法探测和适应环境的能力,该方法能够克服机器人模型误差和姿态误差,以及环境干扰等因素对抓线控制的影响.文中给出了算法具体实现步骤,并给出了应用此方法控制除冰机器人抓线的仿真实验. 展开更多
关键词 除冰机器人 k最近分类算法 增强学习 维数灾难
下载PDF
基于深K近邻和朴素贝叶斯分类算法的肿瘤诊断
7
作者 申淑逸 《数码设计》 2020年第16期67-67,共1页
本文试图将深k近邻和朴素叶贝斯分类算法来解决肿瘤诊断的问题。肿瘤现在已经成为我国乃至世界范围内的常见病和多发病,尽早诊断和治疗对肿瘤患者的未来至关重要。异型性是肿瘤异常分化在形态上的表现。肿瘤细胞异型性小,与正常组织相似... 本文试图将深k近邻和朴素叶贝斯分类算法来解决肿瘤诊断的问题。肿瘤现在已经成为我国乃至世界范围内的常见病和多发病,尽早诊断和治疗对肿瘤患者的未来至关重要。异型性是肿瘤异常分化在形态上的表现。肿瘤细胞异型性小,与正常组织相似,分化和低恶性。肿瘤细胞异型性大,与正常组织相似度小,分化程度低,恶性程度高。区别这种异型性的大小是诊断肿瘤,确定其良性、恶性的主要组织学依据,但最大的问题在于准确诊断存在困难。本文从概率的角度,结合深K近邻与朴素贝叶斯分类算法开展研究,对尽可能准确的诊断提出合理的算法。 展开更多
关键词 k最近邻分类算法 朴素贝叶斯分类算法 深度学习 机器学习
下载PDF
基于情感本体和kNN算法的在线评论情感分类研究 被引量:22
8
作者 唐晓波 朱娟 杨丰华 《情报理论与实践》 CSSCI 北大核心 2016年第6期110-114,共5页
[目的/意义]构建针对网络在线评论的情感分析模型,一方面可以为用户决策提供支持;另一方面又可以帮助产品或服务提供商了解用户情感倾向,提升用户体验。[方法/过程]提出了基于情感本体和k NN算法的在线评论情感分类模型。该模型基于情... [目的/意义]构建针对网络在线评论的情感分析模型,一方面可以为用户决策提供支持;另一方面又可以帮助产品或服务提供商了解用户情感倾向,提升用户体验。[方法/过程]提出了基于情感本体和k NN算法的在线评论情感分类模型。该模型基于情感本体,通过对情感词数量和情感程度进行加权,提出了褒义量和贬义量的概念,并以此作为k NN算法的特征向量。通过爬取豆瓣网电影评论进行训练和测试,并分别从褒性评论和贬性评论的角度对分类效果进行评价。[结果/结论]结果表明,本算法在分类准确率和召回率方面都具有不错的水平,但同时对贬性评论分类效果优于褒性评论,为未来研究提供了新的思路。 展开更多
关键词 在线评论 情感分类 k最近邻分类 本体
下载PDF
文档相似矩阵在提高KNN分类效率中的应用 被引量:2
9
作者 路永和 何新宇 《情报理论与实践》 CSSCI 北大核心 2014年第1期141-144,共4页
针对传统KNN分类算法在样本数量大、维度高的情况下相似度计算量大的问题,提出了基于相似矩阵的改进KNN分类算法。该算法通过计算样本两两之间的相似度,建立相似矩阵加速KNN算法中寻找K近邻;以搜狗自然语言实验室的文本分类语料库中的... 针对传统KNN分类算法在样本数量大、维度高的情况下相似度计算量大的问题,提出了基于相似矩阵的改进KNN分类算法。该算法通过计算样本两两之间的相似度,建立相似矩阵加速KNN算法中寻找K近邻;以搜狗自然语言实验室的文本分类语料库中的新闻文档作为实验对象,采用宏平均F测度值作为分类效果评价标准,用改进KNN方法和传统KNN方法进行对比实验。实验结果表明:通过调节参数,本方法能在不损失精度的情况下减少寻找K近邻时相似度计算的次数。 展开更多
关键词 文本分类 k最近邻分类 相似矩阵 算法
下载PDF
基于KNN分类器的分层图像特征提取 被引量:5
10
作者 范洪华 付应雄 +1 位作者 罗志成 陈芬 《湖北大学学报(自然科学版)》 CAS 2019年第1期44-47,54,共5页
给出一种基于k最近邻分类器(KNN)的分层图像特征提取方法.该方法能有效地获得有代表性和判别性的模板集合,并以较低计算复杂度来获取更高的识别精度.
关键词 特征提取 图像识别 k最近邻分类器(kNN)
下载PDF
熵可视化方法在恶意代码分类中的应用 被引量:9
11
作者 任卓君 陈光 《计算机工程》 CAS CSCD 北大核心 2017年第9期167-171,共5页
恶意代码激增极大地威胁着信息系统安全。为提高辨识效率,加快应急响应速度,结合信息熵的定义,利用Jaccard度量和K最近邻分类算法,提出一种新的用于研究恶意代码分类的可视化方法。将二进制文件经局部熵计算转换成熵像素图,从视觉角度... 恶意代码激增极大地威胁着信息系统安全。为提高辨识效率,加快应急响应速度,结合信息熵的定义,利用Jaccard度量和K最近邻分类算法,提出一种新的用于研究恶意代码分类的可视化方法。将二进制文件经局部熵计算转换成熵像素图,从视觉角度直观呈现恶意代码内部特征,通过降维显示机制提高相似度比对和分类的效率。实验结果表明,该方法使用66个族的664个由卡巴斯基命名规则命名的样本进行评估,平均分类准确率为93.67%,能有效地分类恶意代码样本。 展开更多
关键词 恶意代码 可视化 谱系分类 信息熵 Jaccard指数 k最近邻分类算法
下载PDF
基于Spark的输变电线路实时故障监测研究 被引量:4
12
作者 陈建峡 朱季骐 +3 位作者 张月 张晓星 吕俊涛 白德盟 《计算机工程与应用》 CSCD 北大核心 2018年第5期265-270,共6页
输变电线路状态监测数据是智能电网中数据量很大的一部分,不仅包括在线的状态监测数据,还包括设备的基本信息、实验数据、缺陷记录等,在数据处理的可靠性和实时性方面的要求都很高。根据实际应用中输变电线路的故障类型,设计并实现了输... 输变电线路状态监测数据是智能电网中数据量很大的一部分,不仅包括在线的状态监测数据,还包括设备的基本信息、实验数据、缺陷记录等,在数据处理的可靠性和实时性方面的要求都很高。根据实际应用中输变电线路的故障类型,设计并实现了输变电线路实时数据故障监测模型。其中,利用高效处理实时数据的Spark系统,研发出基于Spark的分布式ISODATA和模糊KNN大数据分析算法,与单机KNN算法相比,在时间性能上提高了70.75%效率,具有明显的计算效率优势。 展开更多
关键词 实时大数据 输变电线路 故障监测 分布式迭代自组织数据分析算法(ISODATA) 分布式模糊k最近邻分类算法(kNN)
下载PDF
基于中智KNN的齿轮箱故障诊断方法 被引量:13
13
作者 王栋璀 丁云飞 朱晨烜 《振动与冲击》 EI CSCD 北大核心 2019年第20期148-153,共6页
齿轮箱在旋转机械设备中应用广泛,研究齿轮箱的故障诊断方法意义重大。为提高齿轮箱故障的预警诊断准确度,提出了基于中智KNN(Neutrosophic K-Nearest Neighbor,NKNN)的齿轮箱故障诊断方法。该方法利用小波包对信号特征进行提取,并构建... 齿轮箱在旋转机械设备中应用广泛,研究齿轮箱的故障诊断方法意义重大。为提高齿轮箱故障的预警诊断准确度,提出了基于中智KNN(Neutrosophic K-Nearest Neighbor,NKNN)的齿轮箱故障诊断方法。该方法利用小波包对信号特征进行提取,并构建出故障样本集,借助中智理论对样本的特征权重进行重新分配,建立起基于中智KNN决策规则下的故障诊断模型,并提出了中智划分的概念。实验表明,该方法有效地提升了分类精度和鲁棒性,弥补了传统KNN同贡献权重分配的缺陷,其中智划分的结果可以作为分析齿轮箱混合故障诊断的参考依据。 展开更多
关键词 齿轮箱 中智理论 k最近邻分类 故障诊断
下载PDF
基于敏感特征选择与流形学习维数约简的故障诊断 被引量:41
14
作者 苏祖强 汤宝平 姚金宝 《振动与冲击》 EI CSCD 北大核心 2014年第3期70-75,共6页
针对故障诊断中特征集包含非敏感特征和维数过高的问题,提出基于特征选择(Feature Selection,FS)与流形学习维数约简的故障诊断方法。提出一种改进的核空间距离测度特征选择方法(Improved Kernel Distance Measurement Feature Selectio... 针对故障诊断中特征集包含非敏感特征和维数过高的问题,提出基于特征选择(Feature Selection,FS)与流形学习维数约简的故障诊断方法。提出一种改进的核空间距离测度特征选择方法(Improved Kernel Distance Measurement Feature Selection,IKDM-FS),在核空间中计算样本类间距离和类内散度,优选出使样本类间距大、类内散度小的特征,并根据特征的敏感程度对特征进行加权。通过线性局部切空间排列算法(Linear Local Tangent Space Alignment,LLTSA)对由敏感特征组成的特征子集进行特征融合,提取出对故障分类更加敏感的融合特征,并输入加权k最近邻分类器(Weighted k Nearest Neighbor Classifier,WKNNC)进行故障识别。WKNNC具有比k最近邻分类器(k Nearest Neighbor Classifier,KNNC)更加稳定的识别精度。最后,通过滚动轴承故障模拟实验验证了该方法的有效性。 展开更多
关键词 故障诊断 特征选择 改进的核空间距离测度 线性局部切空间排列 加权k最近邻分类
下载PDF
基于正交半监督局部Fisher判别分析的故障诊断 被引量:15
15
作者 苏祖强 汤宝平 +1 位作者 刘自然 秦毅 《机械工程学报》 EI CAS CSCD 北大核心 2014年第18期7-13,共7页
针对有标记故障样本不足和故障特征集维数过高的问题,提出基于正交半监督局部Fisher判别分析(Orthogonal semi-supervised local Fisher discriminant analysis,OSELF)的故障诊断方法。所提出的OSELF能够充分地利用蕴含于无标记故障样... 针对有标记故障样本不足和故障特征集维数过高的问题,提出基于正交半监督局部Fisher判别分析(Orthogonal semi-supervised local Fisher discriminant analysis,OSELF)的故障诊断方法。所提出的OSELF能够充分地利用蕴含于无标记故障样本中的故障信息,避免了因有标记故障样本不足引起的过学习问题,同时采用正交迭代方式求解最优正交映射矩阵,克服现有方法无法得到正交映射矩阵的不足。正交映射矩阵的基矢量统计不相关,可有效地提高所得低维特征矢量的可辨识性。通过正交映射矩阵对故障样本集和新增样本进行维数约简,并将维数约简的结果输入粗糙优化k最近邻分类器(Coarse to fine k nearest neighbor classifier,CFKNNC)进行学习训练和故障识别。所提方法集成了OSELF在维数约简和CFKNNC在模式识别的优势,有效地提高了故障诊断的精度。通过齿轮箱故障模拟试验验证了该方法的有效性。 展开更多
关键词 故障诊断 维数约简 正交半监督局部Fisher判别分析 粗糙优化k最近邻分类
下载PDF
局部文本特征选取算法的比较和改进研究 被引量:6
16
作者 李纲 夏晨曦 郑重 《情报学报》 CSSCI 北大核心 2008年第4期506-511,共6页
本文通过实验比较了互信息、X^2统计算法和优势率三种算法在用于局部文本特征选取时对文本分类性能的影响。实验结果显示,在应用于局部特征选择的情况下,文本特征选取算法仍然可以将特征空间的维度降低90%以上,而不降低文本分类的... 本文通过实验比较了互信息、X^2统计算法和优势率三种算法在用于局部文本特征选取时对文本分类性能的影响。实验结果显示,在应用于局部特征选择的情况下,文本特征选取算法仍然可以将特征空间的维度降低90%以上,而不降低文本分类的性能。同时,我们发现在应用于局部文本特征选取时,优势率算法的性能不如互信息和X^2统计算法。另外,对于K最近邻分类算法,随着足值的增大,文本分类的查准率在增加,而查全率在降低。最后,本文详细分析了造成这三种算法性能差异的原因,并提出了一种改进算法,来提高优势率算法应用于局部文本特征选取时的性能。 展开更多
关键词 文本分类 局部特征选择 互信息算法 x^2统计算法 优势率算法 k最近邻分类算法
下载PDF
基于多特征融合的唐卡图像法器识别方法 被引量:4
17
作者 王铁君 王维兰 《计算机工程》 CAS CSCD 北大核心 2016年第3期198-203,207,共7页
唐卡图像具有内容丰富、画面复杂、色彩表现层次多等特点,但部分图像存在破损残缺、清晰度不高的不足。为此,提出一种融合Hu矩和局部二进制模式的图像特征提取方法,提高目标图像的特征表现程度,并在此基础上给出一种改进的基于距离密度... 唐卡图像具有内容丰富、画面复杂、色彩表现层次多等特点,但部分图像存在破损残缺、清晰度不高的不足。为此,提出一种融合Hu矩和局部二进制模式的图像特征提取方法,提高目标图像的特征表现程度,并在此基础上给出一种改进的基于距离密度的K最近邻分类算法,该算法待测样本所属的类别与其周围邻近点的类别最相关,且距离越近,相关度越高。实验结果表明,与传统的k NN、神经网络和神经网络集成方法相比,该方法对唐卡图像中的法器对象具有更高的识别正确率,能有效实现唐卡图像中法器对象的分类识别。 展开更多
关键词 唐卡图像 图像识别 k最近邻分类算法 神经网络 局部二值模式
下载PDF
一种垃圾邮件快速识别方法 被引量:2
18
作者 李霞 蒋盛益 《小型微型计算机系统》 CSCD 北大核心 2013年第3期498-502,共5页
k最近邻分类算法原理简单且分类性能好,但因其时间复杂度高,不适用于实际领域在线垃圾邮件过滤.本文在建模阶段首先对训练邮件进行初始聚类,将训练邮件划分为半径大小几乎相同的初始簇,然后使用共享最近邻图聚类算法对包含邮件的初始簇... k最近邻分类算法原理简单且分类性能好,但因其时间复杂度高,不适用于实际领域在线垃圾邮件过滤.本文在建模阶段首先对训练邮件进行初始聚类,将训练邮件划分为半径大小几乎相同的初始簇,然后使用共享最近邻图聚类算法对包含邮件的初始簇进行再聚类,最终聚类簇被看成是可以增量更新的分类模型,最后使用经典k最近邻分类算法在该分类模型上对未知邮件进行分类.在公开语料Ling-Spam上的实验结果表明,本文提出的垃圾邮件识别算法不仅具有较高的垃圾邮件识别精度,而且还具有较低的时间复杂度. 展开更多
关键词 垃圾邮件过滤 k最近邻分类算法 共享最近图聚类算法
下载PDF
带有特征选取电站锅炉燃烧效率建模 被引量:2
19
作者 唐振浩 吴笑妍 曹生现 《哈尔滨理工大学学报》 CAS 北大核心 2020年第2期1-7,共7页
针对电站锅炉效率难以准确测定问题,依据机器学习理论,采用数据驱动建模方法建立锅炉效率预测模型。分类回归树(CART)算法通过数据分析选取对锅炉效率影响显著的相关变量。然后,K最近邻(KNN)分类器对相关变量的样本进行分类,区分不同工... 针对电站锅炉效率难以准确测定问题,依据机器学习理论,采用数据驱动建模方法建立锅炉效率预测模型。分类回归树(CART)算法通过数据分析选取对锅炉效率影响显著的相关变量。然后,K最近邻(KNN)分类器对相关变量的样本进行分类,区分不同工况生产数据。根据不同工况数据,设计了一种基于差分进化算法(DE)的最小二乘支持向量机(LSSVM)建立数据驱动模型(DDMMF),DE动态优化LSSVM的参数以提高模型精度。最后,对预测模型进行动态修正进一步提高预测精度。基于实际生产数据的实验结果表明,该模型能够准确预测锅炉燃烧效率,满足锅炉燃烧过程控制和优化的需求。 展开更多
关键词 特征选取 k最近邻分类 数据驱动模型 模型修正 锅炉燃烧效率
下载PDF
数字电表图像的检测与识别 被引量:3
20
作者 沈美丽 《现代电子技术》 2022年第16期110-114,共5页
为降低传统机械式电表读取的人工成本,提升电子屏图像数据的提取效率,文中设计一种基于图像处理的电表读数智能检测系统。该系统主要由数字检测与数字识别两个模块构成。数字检测模块通过特有图像特征对电子屏区域进行定位与提取,随后... 为降低传统机械式电表读取的人工成本,提升电子屏图像数据的提取效率,文中设计一种基于图像处理的电表读数智能检测系统。该系统主要由数字检测与数字识别两个模块构成。数字检测模块通过特有图像特征对电子屏区域进行定位与提取,随后对区域内的数字由粗至精逐步进行精细框选,实现对单个数字的分割过程。数字识别模块采用大量数字图像对K最近邻分类算法进行训练,得到识别模型后,判断检测模块中分割数字的类别。以摄像头拍摄的特定电表为检测对象,经过工厂实地图像取样,通过编程和实验结果分析,证明文中检测系统能够较好地检测出电子屏幕中显示的数字个数并准确判断出数字类别,识别度高于97%。此电表读数智能检测系统可有效节省人力投入,降低出错率,能够依据实际需求对模型进行调整,从而应用于不同类型的电表图像识别。 展开更多
关键词 数字提取 ROI提取 数字识别 k最近邻分类 图像分割 数字电表 图像特征 数字切割 欧氏距离
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部