期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于改进K-NN和SVM的多学科协作诊疗决策支持系统 被引量:1
1
作者 李晓峰 王妍玮 李东 《计算机系统应用》 2020年第6期80-88,共9页
由于当前的诊疗决策支持系统采用单一学科的决策方法,导致诊疗精度不高,获取的数据分类结果准确率较低,提出并设计一种基于改进K-NN(K-Nearest Neighbour)分类算法和SVM(Support Vector Mechine)的多学科协作诊疗决策支持系统.在构建系... 由于当前的诊疗决策支持系统采用单一学科的决策方法,导致诊疗精度不高,获取的数据分类结果准确率较低,提出并设计一种基于改进K-NN(K-Nearest Neighbour)分类算法和SVM(Support Vector Mechine)的多学科协作诊疗决策支持系统.在构建系统总体框架的基础上,对数据库系统模块、人机交互模块和诊疗推理模块进行设计,其中诊疗推理模块是系统的软件核心,通过改进K-NN分类算法和SVM建立推理引擎,在计算机的辅助下,搜索与患者病症信息相似的医疗案例,并进行相似度匹配,根据匹配结果与患者症状集构建一个新的临床案例,引入CDA(Clinical Document Architecture)概念,实现改进K-NN分类算法和SVM算法的有效融合,完成多学科协作诊疗决策.实验结果表明,与传统系统相比,该系统的诊疗决策精度高,评价指标测试平均值达到95.98%,分类结果准确率较高,在该系统辅助下能提高医生诊断正确性,降低误诊率,且运算复杂度较低. 展开更多
关键词 改进K-nn分类算法 SVM 多学科协作 诊疗决策支持系统
下载PDF
基于邻域粗糙集的加权KNN肿瘤基因表达谱分类算法 被引量:1
2
作者 陈智勤 《计算机系统应用》 2010年第12期86-89,16,共5页
肿瘤亚型的准确判别对肿瘤的治疗具有重要意义,对肿瘤的不同亚型进行准确判别是当前生物信息学研究的重要课题.本文首先利用Relief算法排序基因并选出初始的肿瘤信息基因子集,然后利用向基于邻域粗糙集模型的向前属性约减算法FARNeM来... 肿瘤亚型的准确判别对肿瘤的治疗具有重要意义,对肿瘤的不同亚型进行准确判别是当前生物信息学研究的重要课题.本文首先利用Relief算法排序基因并选出初始的肿瘤信息基因子集,然后利用向基于邻域粗糙集模型的向前属性约减算法FARNeM来计算加权基因集合,最后用加权KNN算法对肿瘤对这些数据进行分析,从而发现有差异的基因表达。实验结果表明了上述方法的可行性和有效性。 展开更多
关键词 基因表达谱 肿瘤分类 邻域粗糙集 加权K-nn算法
下载PDF
基于双层结构的加速K-NN分类方法 被引量:3
3
作者 王晓 赵丽 《计算机工程与设计》 北大核心 2018年第4期1071-1077,共7页
在传统K-NN分类中,对于每个待测样本均需计算并寻找k个决策近邻,分类效率较低。针对该问题,提出一种双层结构的加速K-NN分类(K-NN classification based on double-layer structure,KNN_DL)方法。将正类和负类样本分别划分为多个不同子... 在传统K-NN分类中,对于每个待测样本均需计算并寻找k个决策近邻,分类效率较低。针对该问题,提出一种双层结构的加速K-NN分类(K-NN classification based on double-layer structure,KNN_DL)方法。将正类和负类样本分别划分为多个不同子集,计算每个子集的中心和半径。当新样本进入时,选择k个决策近邻子集,若其具有相同的类别标签,将该样本标记为相应类别;反之,选择决策近邻子集中最近的k个决策近邻。这种双层结构的加速方式,压缩待测样本的决策近邻规模,提高效率。实验结果表明,KNN_DL方法能够获得较高的样本预测速度和较好的预测准确率。 展开更多
关键词 K-nn分类 决策近邻子集 决策近邻样本 中心 半径 Knn_DL方法
下载PDF
多分类器联合虚警可控的海上小目标检测方法 被引量:4
4
作者 薛安克 毛克成 张乐 《电子与信息学报》 EI CSCD 北大核心 2023年第7期2528-2536,共9页
模式识别技术已经广泛应用于海上目标检测,其中二分类的模式识别算法在处理该问题时会面临类别非均衡的困境。传统方法一般通过添加人工仿真目标回波扩充目标数据集,检测结果容易受到仿真精度的影响,且增加算法的复杂度。该文提出一种... 模式识别技术已经广泛应用于海上目标检测,其中二分类的模式识别算法在处理该问题时会面临类别非均衡的困境。传统方法一般通过添加人工仿真目标回波扩充目标数据集,检测结果容易受到仿真精度的影响,且增加算法的复杂度。该文提出一种基于多分类思想的多特征海上小目标智能检测方法,先对海杂波数据与目标数据进行多维特征提取,构建高维特征空间;再基于多分类思想中的“1对1”方法,将海杂波特征空间划分成多个子空间,每个杂波子空间与目标数据特征空间等大,构造多个二分类器进行联合判决。该文选取的二分类器为改进的双参数K近邻(K-NN)算法,可有效调节虚警率。经冰多参数成像X波段雷达(IPIX)数据集验证,所提方法在观测时间为1.024 s时获得了82.40%的检测概率,与基于K-NN的检测器做比较,获得了2%的性能提升。 展开更多
关键词 海杂波 小目标检测 多分类 双参数寻优K近邻(K-nn)算法 可控虚警
下载PDF
GNN-CRC: Discriminative Collaborative Representation-Based Classification via Gabor Wavelet Transformation and Nearest Neighbor
5
作者 ZHANG Yanghao ZENG Shaoning +1 位作者 ZENG Wei GOU Jianping 《Journal of Shanghai Jiaotong university(Science)》 EI 2018年第5期657-665,共9页
Collaborative representation-based classification(CRC) is a distance based method, and it obtains the original contributions from all samples to solve the sparse representation coefficient. We find out that it helps t... Collaborative representation-based classification(CRC) is a distance based method, and it obtains the original contributions from all samples to solve the sparse representation coefficient. We find out that it helps to enhance the discrimination in classification by integrating other distance based features and/or adding signal preprocessing to the original samples. In this paper, we propose an improved version of the CRC method which uses the Gabor wavelet transformation to preprocess the samples and also adapts the nearest neighbor(NN)features, and hence we call it GNN-CRC. Firstly, Gabor wavelet transformation is applied to minimize the effects from the background in face images and build Gabor features into the input data. Secondly, the distances solved by NN and CRC are fused together to obtain a more discriminative classification. Extensive experiments are conducted to evaluate the proposed method for face recognition with different instantiations. The experimental results illustrate that our method outperforms the naive CRC as well as some other state-of-the-art algorithms. 展开更多
关键词 face recognition COLLABORATIVE REPRESENTATION GABOR wavelet transformation nearest NEIGHBOR (nn) image classification
原文传递
基于LDA主题模型的短文本分类方法 被引量:76
6
作者 张志飞 苗夺谦 高灿 《计算机应用》 CSCD 北大核心 2013年第6期1587-1590,共4页
针对短文本的特征稀疏性和上下文依赖性两个问题,提出一种基于隐含狄列克雷分配模型的短文本分类方法。利用模型生成的主题,一方面区分相同词的上下文,降低权重;另一方面关联不同词以减少稀疏性,增加权重。采用K近邻方法对自动抓取的网... 针对短文本的特征稀疏性和上下文依赖性两个问题,提出一种基于隐含狄列克雷分配模型的短文本分类方法。利用模型生成的主题,一方面区分相同词的上下文,降低权重;另一方面关联不同词以减少稀疏性,增加权重。采用K近邻方法对自动抓取的网易页面标题数据进行分类,实验表明新方法在分类性能上比传统的向量空间模型和基于主题的相似性度量分别高5%和2.5%左右。 展开更多
关键词 短文本 分类 K近邻 相似度 隐含狄列克雷分配
下载PDF
一种快速的基于稀疏表示分类器 被引量:19
7
作者 陈才扣 喻以明 史俊 《南京大学学报(自然科学版)》 CSCD 北大核心 2012年第1期70-76,共7页
基于稀疏表示的分类器(sparse representation-based classifier,SRC)被证实是一种非常有效的分类器.但SRC往往要通过一个超完备基来求得测试样本的稀疏表示,当数据库的数据量较大时,算法的计算复杂度成为限制其优良性能的瓶颈,致使SRC... 基于稀疏表示的分类器(sparse representation-based classifier,SRC)被证实是一种非常有效的分类器.但SRC往往要通过一个超完备基来求得测试样本的稀疏表示,当数据库的数据量较大时,算法的计算复杂度成为限制其优良性能的瓶颈,致使SRC无法用于实时识别.针对该问题,提出一种简便有效的改进算法,其试图寻求一个较小的超完备基来计算测试样本的稀疏表示,从而大大的缩减算法的计算复杂度.具体来说,对于每个测试样本点,首先,求出该测试样本点可能归属的类别,而后利用可能归属类的样本而并非所有的训练样本来对测试样本进行稀疏表示计算.ORL人脸库和FERET人脸库上的实验结果表明改进算法不仅能较大程度的缩减算法的计算复杂度,而且排除了干扰类的影响,从而在某种程度上提高了算法的识别率. 展开更多
关键词 稀疏表示 K-近邻 邻近类 分类方法 人脸识别
下载PDF
一种基于混合策略的失衡数据集分类方法 被引量:16
8
作者 李鹏 王晓龙 +1 位作者 刘远超 王宝勋 《电子学报》 EI CAS CSCD 北大核心 2007年第11期2161-2165,共5页
提出了一种有效应用于失衡数据集的分类方法,其核心思想是从样本预处理和分类器改进两方面入手,为失衡数据集的分类问题提供全面的解决方案.首先创造性地采用动态自组织映射聚类的方法对失衡数据集进行重采样,这种采样方法,有效地解决... 提出了一种有效应用于失衡数据集的分类方法,其核心思想是从样本预处理和分类器改进两方面入手,为失衡数据集的分类问题提供全面的解决方案.首先创造性地采用动态自组织映射聚类的方法对失衡数据集进行重采样,这种采样方法,有效地解决了传统重采样的方法随机性强,人为主观干扰以及信息损失等弊端.随后借助K-近邻规则的思想,对新采集的样本进行剪枝,有效地解决了实际存在的数据混叠现象.算法对SVM的核函数进行等角变换,由此对类边界进行了校准,以适应样本类别失衡的情况.通过对三种算法的对比实验证明了算法在失衡数据集分类上的有效性.本文的算法已经在答案抽取技术中得到了成功应用,并在TREC2006国际QA评测中得到了客观充分的验证. 展开更多
关键词 失衡数据集 分类 支持向量机 动态自组织映射 K-近邻
下载PDF
基于局部均值的K-近质心近邻光谱分类 被引量:3
9
作者 屠良平 魏会明 +3 位作者 王志衡 韦鹏 罗阿理 赵永恒 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2015年第4期1103-1106,共4页
天体光谱包含着许多重要的关于天体的物理和化学信息,如天体表面的有效温度、重力加速度以及化学丰度等,天体光谱的处理和分析对天文研究具有重要的科学意义。一些大型巡天计划的实施(如SDSS,LAMOST等)使我们获得了海量的天文光谱数据,... 天体光谱包含着许多重要的关于天体的物理和化学信息,如天体表面的有效温度、重力加速度以及化学丰度等,天体光谱的处理和分析对天文研究具有重要的科学意义。一些大型巡天计划的实施(如SDSS,LAMOST等)使我们获得了海量的天文光谱数据,因此天文光谱数据的自动分类成为重要的科学研究课题,然而面对如此海量的光谱数据,一些传统的光谱自动分类方法已经不适用,迫切需要寻找高效率的光谱自动分类技术。研究了基于局部均值的K-近质心近邻(local mean-based K-nearest centroid neighbor,LMKNCN)算法在恒星(Star)、星系(Galaxy)和类星体(Quasar,QSO)的光谱分类中的应用。LMKNCN算法的基本思想是根据近质心近邻原则,从每一类训练样本集中为待测样本点选取k个近质心近邻点,然后根据每一类中所选取的k个近质心近邻点的均值点到待测样本点x的距离来判别x的所属类别。针对美国SDSS-DR8的天体光谱数据,对比了K-近邻、K-近质心近邻、LMKNCN三种算法在恒星、星系和类星体的光谱分类中所表现的性能,结果表明三种方法中,LMKNCN算法对这三种光谱的识别率高于其他两种算法或者与其相当,而且其平均分类正确率高于另外两种算法,特别是在类星体的识别率上表现的更好。表明了该算法对天文光谱大数据的快速处理和有效利用具有重要的意义。 展开更多
关键词 光谱分类 K-近邻 近质心近邻 K-近质心近邻
下载PDF
融合邻域信息的k-近邻分类 被引量:3
10
作者 林耀进 李进金 +1 位作者 陈锦坤 马周明 《智能系统学报》 CSCD 北大核心 2014年第2期240-243,共4页
距离度量是影响k-近邻(KNN)法分类精度的重要因素之一。提出一种融合邻域信息的k-近邻算法。首先,定义了样本邻域的概念,并根据邻域的影响提出2条相应准则;然后,在计算测试样本与训练样本的距离时,综合考虑了样本邻域所带来的影响。该... 距离度量是影响k-近邻(KNN)法分类精度的重要因素之一。提出一种融合邻域信息的k-近邻算法。首先,定义了样本邻域的概念,并根据邻域的影响提出2条相应准则;然后,在计算测试样本与训练样本的距离时,综合考虑了样本邻域所带来的影响。该算法不仅可以更加精确地刻画样本之间的距离,而且一定程度上增强了KNN的稳定性。该方法在UCI标准数据集上进行了测试,结果表明,性能优于或与其他相关的分类器相当,并且在噪声扰动下具有较强的鲁棒性。 展开更多
关键词 K-近邻 邻域信息 分类学习 距离测量 噪音干扰
下载PDF
数据分布特性的自适应流形学习方法 被引量:3
11
作者 李冬睿 李梅 《小型微型计算机系统》 CSCD 北大核心 2014年第6期1387-1391,共5页
数据点的局部邻域选取是基于流形学习的非线性降维方法的核心,其选取方式直接影响降维结果的质量.传统的局部邻域选取方式大多使用最近邻k-nn方法.然而,k的选择是一个难于解决的问题,且k-nn方法对分布不均匀的数据将不再适用.基于此,提... 数据点的局部邻域选取是基于流形学习的非线性降维方法的核心,其选取方式直接影响降维结果的质量.传统的局部邻域选取方式大多使用最近邻k-nn方法.然而,k的选择是一个难于解决的问题,且k-nn方法对分布不均匀的数据将不再适用.基于此,提出一种基于数据分布特性的自适应流形学习方法.该方法根据数据点附近的密集程度来自适应地选择最近邻域大小,充分考虑了数据点周围的点分布信息,能够有效地进行降维,非常适用于分布不均匀的数据.实验结果表明,提出的方法在COIL-20对象数据集和人工数据集上得到了期望的嵌入和分类结果,并成功地应用到了图像检索中. 展开更多
关键词 局部邻域 流形学习 降维 k最近邻
下载PDF
一种基于线性邻域传播的加权K近邻算法 被引量:2
12
作者 王小攀 马丽 刘福江 《计算机工程》 CAS CSCD 2013年第7期288-292,共5页
为提高高光谱遥感影像在训练样本不足时的分类精度,提出一种基于线性邻域传播的改进加权K近邻算法。采用线性邻域传播(LNP)算法获取无标签数据属于各类别的概率,将其作为类别信息,以增加训练样本数量,提高K近邻算法的分类效果,并降低错... 为提高高光谱遥感影像在训练样本不足时的分类精度,提出一种基于线性邻域传播的改进加权K近邻算法。采用线性邻域传播(LNP)算法获取无标签数据属于各类别的概率,将其作为类别信息,以增加训练样本数量,提高K近邻算法的分类效果,并降低错误分类带来的风险。实验结果表明,对于高光谱遥感影像,该算法具有较好的分类效果,优于传统的KNN算法、距离加权KNN算法以及LNP等半监督分类算法。 展开更多
关键词 半监督学习 高光谱遥感 分类 线性邻域传播 加权K近邻 流形学习
下载PDF
基于聚类的加速k-近邻分类方法 被引量:6
13
作者 任丽芳 《计算机应用与软件》 CSCD 2015年第10期298-301,共4页
实际生活中,经常会遇到大规模数据的分类问题,传统k-近邻k-NN(k-Nearest Neighbor)分类方法需要遍历整个训练样本集,因此分类效率较低,无法处理具有大规模训练集的分类任务。针对这个问题,提出一种基于聚类的加速k-NN分类方法 C_kNN(Spe... 实际生活中,经常会遇到大规模数据的分类问题,传统k-近邻k-NN(k-Nearest Neighbor)分类方法需要遍历整个训练样本集,因此分类效率较低,无法处理具有大规模训练集的分类任务。针对这个问题,提出一种基于聚类的加速k-NN分类方法 C_kNN(Speeding k-NN Classification Method Based on Clustering)。该方法首先对训练样本进行聚类,得到初始聚类结果,并计算每个类的聚类中心,选择与聚类中心相似度最高的训练样本构成新的训练样本集,然后针对每个测试样本,计算新训练样本集中与其相似度最高的k个样本,并选择该k个近邻样本中最多的类别标签作为该测试样本的预测模式类别。实验结果表明,C_k-NN分类方法在保持较高分类精度的同时大幅度提高模型的分类效率。 展开更多
关键词 k-近邻分类 聚类 相似度 训练样本集 C_k-nn算法
下载PDF
基于样本密度加权的神经网络分类器在文本分类中的应用 被引量:1
14
作者 廖一星 《计算机应用与软件》 CSCD 2009年第9期234-236,239,共4页
为了提高文本分类精度,根据训练集的样本密度的不同,提出了一种基于k最近邻密度估计的样本加权算法,从而使得样本密度较大的样本权重得到加强,处于样本密度平均水平的样本权重保持不变,而样本密度较小的样本权重得到减弱。并将这种方法... 为了提高文本分类精度,根据训练集的样本密度的不同,提出了一种基于k最近邻密度估计的样本加权算法,从而使得样本密度较大的样本权重得到加强,处于样本密度平均水平的样本权重保持不变,而样本密度较小的样本权重得到减弱。并将这种方法所构成的神经网络分类器用于文本分类。实验结果表明,这种方法可以在一定程度上提高文本分类精度,优于原始的未加权的分类方法。 展开更多
关键词 k最近邻密度估计 神经网络 文本分类
下载PDF
一种并行的加速K-近邻分类方法 被引量:1
15
作者 王秀华 王建珍 《太原师范学院学报(自然科学版)》 2014年第4期44-46,79,共4页
文章针对传统K-近邻分类方法学习效率低下的问题,提出一种基于并行计算的加速K-近邻分类方法(K-nearest neighbor classification method based on parallel computing,PKNN),即并行K-近邻分类.该方法首先将所需要分类的样本划分为不同... 文章针对传统K-近邻分类方法学习效率低下的问题,提出一种基于并行计算的加速K-近邻分类方法(K-nearest neighbor classification method based on parallel computing,PKNN),即并行K-近邻分类.该方法首先将所需要分类的样本划分为不同的工作子集,然后在每个子集上进行并行的K-近邻分类.由于划分后每个工作子集的规模均远小于整个数据集的规模,因此降低了分类算法的复杂度,可有效处理大规模数据的分类问题.实验结果表明,PK-NN方法能提高分类效率. 展开更多
关键词 K-近邻分类 并行计算 并行K-近邻分类 工作子集
下载PDF
针对虚拟人的文本情感语义分析
16
作者 徐芳 侯进 +1 位作者 吴玲 向宇 《西南科技大学学报》 CAS 2012年第1期40-43,共4页
为了使个性化虚拟人更加形象生动,能根据用户输入的文本做出表情动作,运用自然语言处理技术对中文和英文文本进行语义和分类处理,分析出动作和情感信息。采用潜在语义方法从文本中提取出动作语义信息,利用hownet计算词汇相似度,使用K最... 为了使个性化虚拟人更加形象生动,能根据用户输入的文本做出表情动作,运用自然语言处理技术对中文和英文文本进行语义和分类处理,分析出动作和情感信息。采用潜在语义方法从文本中提取出动作语义信息,利用hownet计算词汇相似度,使用K最近邻方法将文本情感信息分为6类:愤怒、厌恶、恐惧、喜悦、悲伤和惊讶。实验结果为:语料文本分类准确率为87.5%,系统能从用户输入的文本中提取出情感、动作信息,使虚拟人做出相应表情变化。 展开更多
关键词 潜在语义分析 词汇相似度 K最近邻方法 情感分类
下载PDF
面向对象的多尺度山地城市土地覆盖信息提取技术研究——以重庆永川区胜利路街道为例
17
作者 黄霞 牟凤云 +1 位作者 刘曦 何顺兵 《重庆第二师范学院学报》 2014年第3期26-29,32,175,共6页
基于eCognition平台,利用面向对象的多尺度分割技术和基于特征的分类方法,对空间分辨率为2.46 m的CBERS 02B HR影像进行了土地覆盖信息提取。采用多尺度分割技术,根据RMAS法计算出最佳分割尺度,基于分割后的对象,首先创建了知识库,然后... 基于eCognition平台,利用面向对象的多尺度分割技术和基于特征的分类方法,对空间分辨率为2.46 m的CBERS 02B HR影像进行了土地覆盖信息提取。采用多尺度分割技术,根据RMAS法计算出最佳分割尺度,基于分割后的对象,首先创建了知识库,然后利用邻近分类的方法进行了土地覆盖信息的分类,提取了影像中的植被、水体、房屋、道路等信息,并利用最佳分类结果精度与分类稳定性两种方法进行了成果精度评价。结果表明:面向对象的多尺度的土地覆盖提取方法除能较好地利用影像的光谱信息外,更能充分利用影像的纹理、形状、大小等空间信息,能较高精度地提取山地城市复杂的土地覆被信息,其中适宜植被的分割尺度为25,房屋的最佳分割尺度为20,水体与道路最佳分割尺度为15,分类精度平均达95.63%。该方法具有较强的可行性及推广性。 展开更多
关键词 面向对象 山地城市 土地覆盖 多尺度分割 邻近分类
下载PDF
改进SMOTE的不平衡数据集成分类算法 被引量:32
18
作者 王忠震 黄勃 +2 位作者 方志军 高永彬 张娟 《计算机应用》 CSCD 北大核心 2019年第9期2591-2596,共6页
针对不平衡数据集的低分类准确性,提出基于改进合成少数类过采样技术(SMOTE)和AdaBoost算法相结合的不平衡数据分类算法(KSMOTE-AdaBoost)。首先,根据K近邻(K NN)的思想,提出噪声样本识别算法,通过样本的K个近邻中所包含的异类样本数目... 针对不平衡数据集的低分类准确性,提出基于改进合成少数类过采样技术(SMOTE)和AdaBoost算法相结合的不平衡数据分类算法(KSMOTE-AdaBoost)。首先,根据K近邻(K NN)的思想,提出噪声样本识别算法,通过样本的K个近邻中所包含的异类样本数目,对样本集中的噪声样本进行精确识别并予以滤除;其次,在过采样过程中基于聚类的思想将样本集划分为不同的子簇,根据子簇的簇心及其所包含的样本数目,在簇内样本与簇心之间进行新样本的合成操作。在样本合成过程中充分考虑类间和类内数据不平衡性,对样本及时修正以保证合成样本质量,平衡样本信息;最后,利用AdaBoost算法的优势,采用决策树作为基分类器,对平衡后的样本集进行训练,迭代多次直到满足终止条件,得到最终分类模型。选择G-mean、AUC作为评价指标,通过在6组KEEL数据集进行对比实验。实验结果表明,所提的过采样算法与经典的过采样算法SMOTE、自适应综合过采样技术(ADASYN)相比,G-means和AUC在4组中有3组最高;所提分类模型与现有的不平衡分类模型SMOTE-Boost,CUS-Boost,RUS-Boost相比,6组数据中:G-means均高于CUS-Boost和RUS-Boost,有3组低于SMOTE-Boost;AUC均高于SMOTE-Boost和RUS-Boost,有1组低于CUS-Boost。验证了所提的KSMOTE-AdaBoost具有更好的分类效果,且模型泛化性能更高。 展开更多
关键词 不平衡数据分类 合成少数类过采样技术 K近邻 过采样 聚类 ADABOOST算法
下载PDF
一种基于近邻元分析的文本分类算法 被引量:10
19
作者 刘丛山 李祥宝 杨煜普 《计算机工程》 CAS CSCD 2012年第15期139-141,共3页
在近邻元分析(NCA)算法的基础上,提出K近邻元分析分类算法K-NCA。利用NCA算法完成对训练样本集的距离测度学习和降维,定义类偏斜因子,引入K近邻思想,得到测试样本的类条件概率估计,并通过该概率进行类别判定,实现文本分类器功能。实验... 在近邻元分析(NCA)算法的基础上,提出K近邻元分析分类算法K-NCA。利用NCA算法完成对训练样本集的距离测度学习和降维,定义类偏斜因子,引入K近邻思想,得到测试样本的类条件概率估计,并通过该概率进行类别判定,实现文本分类器功能。实验结果表明,K-NCA算法的分类效果较好。 展开更多
关键词 近邻元分析 距离测度学习 降维 K近邻 文本分类
下载PDF
两种基于K近邻特征选择算法的对比分析 被引量:7
20
作者 薛又岷 严玉萍 +1 位作者 古嘉玲 包晓蓉 《电子设计工程》 2016年第1期19-22,共4页
在特征选择过程中,针对近邻错误分类率较低的问题,分别采用正向贪心和逆向贪心思想设计了两种启发式特征选择算法,其目的是在降低数据集中特征数量的同时,能够进一步降低近邻错误分类率。通过8组UCI数据集上的交叉验证结果表明,相比于... 在特征选择过程中,针对近邻错误分类率较低的问题,分别采用正向贪心和逆向贪心思想设计了两种启发式特征选择算法,其目的是在降低数据集中特征数量的同时,能够进一步降低近邻错误分类率。通过8组UCI数据集上的交叉验证结果表明,相比于正向贪心算法,逆向贪心算法能够删除较多的冗余特征,从而得出逆向贪心算法能够更有效地提高近邻算法的分类精度的结论。 展开更多
关键词 特征选择 启发式算法 贪心算法 近邻错误分类率
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部