期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
K-最邻近算法在文本自动分类中的应用
1
作者 刘卓 《苏州市职业大学学报》 2010年第2期58-60,共3页
对文本的自动分类进行了研究,介绍文本分类的基本过程和文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法——K-最邻近算法.利用K-最邻近算法(KNN)并结合改进的词特征权值计算方法和文本相似度的计算方法完成了文本的自动分... 对文本的自动分类进行了研究,介绍文本分类的基本过程和文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法——K-最邻近算法.利用K-最邻近算法(KNN)并结合改进的词特征权值计算方法和文本相似度的计算方法完成了文本的自动分类.通过KNN方法分类之后的结果的查准率、查全率得以明显提高. 展开更多
关键词 数据挖掘 文本自动分类 k-最邻近算法
下载PDF
基于GF-1 PMS影像和k-NN方法的延庆区森林蓄积量估测 被引量:20
2
作者 王海宾 彭道黎 +1 位作者 高秀会 李文芳 《浙江农林大学学报》 CAS CSCD 北大核心 2018年第6期1070-1078,共9页
应用高分1号(GF-1)全色和多光谱(PMS)影像和k-最邻近(k-NN)方法进行县域尺度的森林蓄积量估测,探讨GF-1 PMS影像以及k-NN方法估测森林蓄积量的适用性。以北京市延庆区森林资源二类调查数据为基础数据,森林蓄积量为研究对象,基于国产GF-1... 应用高分1号(GF-1)全色和多光谱(PMS)影像和k-最邻近(k-NN)方法进行县域尺度的森林蓄积量估测,探讨GF-1 PMS影像以及k-NN方法估测森林蓄积量的适用性。以北京市延庆区森林资源二类调查数据为基础数据,森林蓄积量为研究对象,基于国产GF-1 PMS影像数据提取植被指数,采用k-NN法构建森林蓄积量估测模型,并引入偏最小二乘回归法予以比较,选出最优估测方法对全区森林蓄积量进行反演。结果显示:偏最小二乘回归法估测的森林蓄积量均方根误差为21.90 m^3·hm^(-2),相对均方根误差为27.5%,偏差为17.23 m^3·hm^(-2)。基于k-NN方法的森林蓄积量估测的均方根误差为12.80 m^3·hm^(-2),相对均方根误差为16.0%,偏差为15.02 m^3·hm^(-2)。与官方公布的全区森林蓄积量进行对比,结果显示:基于k-NN法反演的全区森林蓄积量统计结果(245.98万m^3,估测精度为86.0%)要好于偏最小二乘回归法(266.22万m^3,估测精度为76.6%)。最后生成了全区森林蓄积量空间分布图。 展开更多
关键词 森林测计学 森林蓄积量 偏最小二乘回归法 k-最邻近(k-NN)法 GF-1 PMS影像
下载PDF
用k-最近邻和贝叶斯分类预测图书用户喜好 被引量:3
3
作者 钟亮 《信息技术》 2016年第9期62-65,共4页
将用户兴趣爱好、书籍受欢迎程度和用户对书籍的评价等参数组成差异性矩阵,确定各参数影响权重、建模计算用户对书籍的评分,融合采用k-最近邻分类法和朴素贝叶斯分类法来分类过滤数据,设计实现一种数字图书用户喜好预测算法。实验结果表... 将用户兴趣爱好、书籍受欢迎程度和用户对书籍的评价等参数组成差异性矩阵,确定各参数影响权重、建模计算用户对书籍的评分,融合采用k-最近邻分类法和朴素贝叶斯分类法来分类过滤数据,设计实现一种数字图书用户喜好预测算法。实验结果表明,该算法提高了数字图书个性化推荐精度。 展开更多
关键词 数字图书 个性化推荐 k-最邻近分类 朴素贝叶斯分类 内容过滤
下载PDF
基于KNN图的空间离群点挖掘算法 被引量:3
4
作者 张忠平 徐晓云 王培 《计算机工程》 CAS CSCD 北大核心 2011年第4期37-39,共3页
空间数据集中离群数据与正常数据之间的非空间属性值相差较大。针对该情况,提出一种基于K-最邻近(KNN)图的空间离群点挖掘算法。该算法通过所有对象的K近邻关系构造KNN图,将相邻对象非空间属性值的差作为2个对象点间的边权值,利用裁边... 空间数据集中离群数据与正常数据之间的非空间属性值相差较大。针对该情况,提出一种基于K-最邻近(KNN)图的空间离群点挖掘算法。该算法通过所有对象的K近邻关系构造KNN图,将相邻对象非空间属性值的差作为2个对象点间的边权值,利用裁边策略去掉权值较高的边,从而识别出空间离群点和离群区域。实验结果表明,该算法的时间性能优于POD算法。 展开更多
关键词 空间离群点 k-最邻近 非空间属性值
下载PDF
基于概率神经网络的文本自动分类研究 被引量:14
5
作者 施洁斌 《情报学报》 CSSCI 北大核心 2004年第2期147-151,共5页
本文提出了将一种径向基网络的重要变形--概率神经网络应用于文本自动分类的研究,与常用的K-最邻近法相比,具有一定的优势,特别是在训练集中各类的训练样本数很不平衡时;与BP等其他神经网络相比,其特点是需调节的参数少,不需确定隐层数... 本文提出了将一种径向基网络的重要变形--概率神经网络应用于文本自动分类的研究,与常用的K-最邻近法相比,具有一定的优势,特别是在训练集中各类的训练样本数很不平衡时;与BP等其他神经网络相比,其特点是需调节的参数少,不需确定隐层数、隐层中的神经元数量等网络结构,比较容易使用.此外,从研究中的不同特征选择的评价函数来看,它们对分类有一定的影响,应用X2统计进行特征选择的分类正确率最高,其次是文本证据权,而期望交叉熵的效果最差,说明特征选择在文本自动分类中也是非常重要的. 展开更多
关键词 概率神经网络 文本自动分类 k-最邻近 情报分析 文本挖掘
下载PDF
基于DTW-KNN的机械通气无效吸气努力检测
6
作者 潘清 龚强 +2 位作者 陆飞 方路平 葛慧青 《计算机应用与软件》 北大核心 2022年第8期331-337,共7页
无效吸气努力(Ineffective Inspiratory Effort during Expiration,IEE)是使用机械通气抢救危重病人过程中最常见的一种人机不同步问题。针对该问题缺乏检测手段的现状,提出基于机械通气波形,采用K最邻近法(K-Nearest Neighbors,KNN)结... 无效吸气努力(Ineffective Inspiratory Effort during Expiration,IEE)是使用机械通气抢救危重病人过程中最常见的一种人机不同步问题。针对该问题缺乏检测手段的现状,提出基于机械通气波形,采用K最邻近法(K-Nearest Neighbors,KNN)结合动态时间规整(Dynamic time warping,DTW)实现IEE检测。在临床采集的数据集上进行测试发现,基于DTW-KNN的方法得到96.5%的特异性和97.2%的灵敏度,优于传统的基于规则的方法和机器学习方法。研究表明,该方法有望用于临床IEE检测,提示医护人员调整呼吸机参数设置,改善病人与呼吸机的同步性,优化重症呼吸治疗。 展开更多
关键词 机械通气 无效吸气努力 k-最邻近 动态时间规整
下载PDF
基于支持向量机的文本自动分类试验研究
7
作者 施洁斌 《现代图书情报技术》 CSSCI 北大核心 2004年第7期27-29,67,共4页
提出了将支持向量机应用于文本自动分类的研究 ,与常用的 K-最邻近法相比 ,无论是对训练数据集还是测试数据集均具有一定的优势 ,而且不同特征选择方法对支持向量机的影响要比 K-最邻近法小。此外 ,从研究中的不同特征选择的评价函数来... 提出了将支持向量机应用于文本自动分类的研究 ,与常用的 K-最邻近法相比 ,无论是对训练数据集还是测试数据集均具有一定的优势 ,而且不同特征选择方法对支持向量机的影响要比 K-最邻近法小。此外 ,从研究中的不同特征选择的评价函数来看 ,它们对分类有一定的影响 ,应用 X2统计进行特征选择的分类正确率最高 ,其次是文本证据权 ,而期望交叉熵的效果最差 ,说明特征选择在文本自动分类中也是相当重要的。 展开更多
关键词 文本自动分类 支持向量机 k-最邻近 特征选择
下载PDF
基于缺失数据修复的变压器在线故障诊断方法 被引量:17
8
作者 陈嘉宁 杨翾 +4 位作者 叶承晋 唐剑 李祥 方响 龙厚印 《电力系统保护与控制》 EI CSCD 北大核心 2019年第15期86-92,共7页
数据质量是影响变压器故障诊断正确率的重要因素。为了解决变压器油色谱在线监测数据缺失问题,提出了一种基于缺失数据修复的变压器在线故障诊断方法,利用改进k-最邻近和多分类SVM的循环迭代实现基于缺失数据的变压器故障诊断。在k-最... 数据质量是影响变压器故障诊断正确率的重要因素。为了解决变压器油色谱在线监测数据缺失问题,提出了一种基于缺失数据修复的变压器在线故障诊断方法,利用改进k-最邻近和多分类SVM的循环迭代实现基于缺失数据的变压器故障诊断。在k-最邻近方法中,提出以相关系数的负指数为权值的曼哈顿距离来度量样本间距离。一方面用以突出强相关指标对缺失信息的影响,提高数据修复的准确性。另一方面改进的曼哈顿距离适用于基于k-d树的高效搜索策略,可以实现针对海量历史数据的快速搜索,满足在线诊断对算法实时性的需求。实例诊断的结果表明,该方法可以有效降低数据缺失对变压器故障诊断正确率的影响,有利于实现变压器故障的准确、高效在线诊断。 展开更多
关键词 变压器 故障诊断 k-最邻近 k-D树 支持向量机
下载PDF
基于RF和KNN的三种肝炎分类模型的建立 被引量:1
9
作者 闫树英 陈志宏 +1 位作者 惠娜 魏玉辉 《宁夏医学杂志》 CAS 2015年第6期496-498,I0001,共4页
目的建立甲、乙、丙三种肝炎的计算机分类模型。方法以病毒学检查为指标确定三种肝炎病例,以患者和健康体检者血常规检查指标、生化检查指标为原始数据建立数据库,其中甲肝病例186例,乙肝病例835例,丙肝病例129例,健康志愿者438人。分... 目的建立甲、乙、丙三种肝炎的计算机分类模型。方法以病毒学检查为指标确定三种肝炎病例,以患者和健康体检者血常规检查指标、生化检查指标为原始数据建立数据库,其中甲肝病例186例,乙肝病例835例,丙肝病例129例,健康志愿者438人。分别采用随机森林和K-最邻近法建立甲、乙、丙三种肝炎的分类模型。结果随机森林筛选出了9个(ALT、GGT、AST、ALB、BUN/Crea、CPT、MO%、TBIL、Cl-1)相对重要的变量,该模型内部预测准确率、测试集的预测准确率分别是92.59%、91.56%,KNN模型内部预测准确率、训练集、测试集的预测准确率分别是93.95%、96.89%、90.23%。结论所建的分类模型对三种肝炎患者和健康人有较好的识别能力。 展开更多
关键词 随机森林 k-最邻近 甲型肝炎 乙型肝炎 丙型肝炎 分类模型
下载PDF
基于I-Miner及S语言的分类算法研究
10
作者 彭钊 蔡藏赋 +1 位作者 杨燕 王飞 《计算机与数字工程》 2008年第10期45-47,161,共4页
分类是一种重要的数据挖掘技术,其目的是根据数据集的特点构造一个分类函数或分类模型(也常常称作分类器),该模型能把未知类别的样本映射到给定类别中的某一个。通过介绍I-Miner下的数据挖掘实验方法,并利用S语言做成的脚本,实现了在I-M... 分类是一种重要的数据挖掘技术,其目的是根据数据集的特点构造一个分类函数或分类模型(也常常称作分类器),该模型能把未知类别的样本映射到给定类别中的某一个。通过介绍I-Miner下的数据挖掘实验方法,并利用S语言做成的脚本,实现了在I-Miner中没有实现的算法,主要介绍S语言实现分类算法中的K-最邻近算法,通过对不同数据集的实验,验证了K-最邻近算法的特性,并以此为今后改进算法做好基础。 展开更多
关键词 分类 k-最邻近 I-Miner S语言
下载PDF
APPROXIMATE QUERY AND CALCULATION OF RNN_k BASED ON VORONOI CELL 被引量:1
11
作者 郝忠孝 李博涵 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI 2009年第2期154-161,共8页
Reverse k nearest neighbor (RNNk) is a generalization of the reverse nearest neighbor problem and receives increasing attention recently in the spatial data index and query. RNNk query is to retrieve all the data po... Reverse k nearest neighbor (RNNk) is a generalization of the reverse nearest neighbor problem and receives increasing attention recently in the spatial data index and query. RNNk query is to retrieve all the data points which use a query point as one of their k nearest neighbors. To answer the RNNk of queries efficiently, the properties of the Voronoi cell and the space-dividing regions are applied. The RNNk of the given point can be found without computing its nearest neighbors every time by using the rank Voronoi cell. With the elementary RNNk query result, the candidate data points of reverse nearest neighbors can he further limited by the approximation with sweepline and the partial extension of query region Q. The approximate minimum average distance (AMAD) can be calculated by the approximate RNNk without the restriction of k. Experimental results indicate the efficiency and the effectiveness of the algorithm and the approximate method in three varied data distribution spaces. The approximate query and the calculation method with the high precision and the accurate recall are obtained by filtrating data and pruning the search space. 展开更多
关键词 computational geometry approximation query filtrating reverse k nearest neighbor (RNNk) Voronoi cell
下载PDF
FUZZY WITHIN-CLASS MATRIX PRINCIPAL COMPONENT ANALYSIS AND ITS APPLICATION TO FACE RECOGNITION 被引量:3
12
作者 朱玉莲 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI 2008年第2期141-147,共7页
Matrix principal component analysis (MatPCA), as an effective feature extraction method, can deal with the matrix pattern and the vector pattern. However, like PCA, MatPCA does not use the class information of sampl... Matrix principal component analysis (MatPCA), as an effective feature extraction method, can deal with the matrix pattern and the vector pattern. However, like PCA, MatPCA does not use the class information of samples. As a result, the extracted features cannot provide enough useful information for distinguishing pat- tern from one another, and further resulting in degradation of classification performance. To fullly use class in- formation of samples, a novel method, called the fuzzy within-class MatPCA (F-WMatPCA)is proposed. F-WMatPCA utilizes the fuzzy K-nearest neighbor method(FKNN) to fuzzify the class membership degrees of a training sample and then performs fuzzy MatPCA within these patterns having the same class label. Due to more class information is used in feature extraction, F-WMatPCA can intuitively improve the classification perfor- mance. Experimental results in face databases and some benchmark datasets show that F-WMatPCA is effective and competitive than MatPCA. The experimental analysis on face image databases indicates that F-WMatPCA im- proves the recognition accuracy and is more stable and robust in performing classification than the existing method of fuzzy-based F-Fisherfaces. 展开更多
关键词 face recognition principal component analysis (PCA) matrix pattern PCA(MatPCA) fuzzy k-nearest neighbor(FKNN) fuzzy within-class MatPCA(F-WMatPCA)
下载PDF
Monitoring nearest neighbor queries with cache strategies 被引量:1
13
作者 PAN Peng LU Yan-sheng 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2007年第4期529-537,共9页
The problem of continuously monitoring multiple K-nearest neighbor (K-NN) queries with dynamic object and query dataset is valuable for many location-based applications. A practical method is to partition the data spa... The problem of continuously monitoring multiple K-nearest neighbor (K-NN) queries with dynamic object and query dataset is valuable for many location-based applications. A practical method is to partition the data space into grid cells, with both object and query table being indexed by this grid structure, while solving the problem by periodically joining cells of objects with queries having their influence regions intersecting the cells. In the worst case, all cells of objects will be accessed once. Object and query cache strategies are proposed to further reduce the I/O cost. With object cache strategy, queries remaining static in current processing cycle seldom need I/O cost, they can be returned quickly. The main I/O cost comes from moving queries, the query cache strategy is used to restrict their search-regions, which uses current results of queries in the main memory buffer. The queries can share not only the accessing of object pages, but also their influence regions. Theoretical analysis of the expected I/O cost is presented, with the I/O cost being about 40% that of the SEA-CNN method in the experiment results. 展开更多
关键词 k-nearest neighbors k-NNs) Continuous query Object cache Query cache
下载PDF
基于非线性流形学习和k-NN的文本分类算法 被引量:3
14
作者 张国栋 张化祥 《山东大学学报(工学版)》 CAS 北大核心 2013年第1期28-33,共6页
为解决文本分类中存在的维数灾难、数据集噪声等问题,本研究提出一种利用非线性维数约简算法结合k-最邻近结点算法(k-nearest neighbor algorithm,k-NN)的文本分类算法。该算法首先对数据集进行去噪处理,再采用非线性流形学习中的局部... 为解决文本分类中存在的维数灾难、数据集噪声等问题,本研究提出一种利用非线性维数约简算法结合k-最邻近结点算法(k-nearest neighbor algorithm,k-NN)的文本分类算法。该算法首先对数据集进行去噪处理,再采用非线性流形学习中的局部线性嵌入算法恢复高维数据中的中低维流形结构,以实现数据约简,利用经过上述处理的文本数据学习k-NN分类器。实验结果表明,该算法能够有效提高文本分类精度。 展开更多
关键词 非线性维数约简算法 k-最邻近结点算法 数据约简 分类
原文传递
融合SIFT特征的熵图估计医学图像非刚性配准 被引量:12
15
作者 张少敏 支力佳 +2 位作者 赵大哲 林树宽 赵宏 《中国图象图形学报》 CSCD 北大核心 2012年第3期412-418,共7页
配准准确性是医学图像配准算法的一项重要指标,像素灰度是目前图像配准中广泛使用的特征,但是灰度特征来源单一,而且忽略空间信息,在一些情况下容易产生误配。针对这个问题,本文提出一种融合SIFT特征的熵图估计医学图像非刚性配准算法... 配准准确性是医学图像配准算法的一项重要指标,像素灰度是目前图像配准中广泛使用的特征,但是灰度特征来源单一,而且忽略空间信息,在一些情况下容易产生误配。针对这个问题,本文提出一种融合SIFT特征的熵图估计医学图像非刚性配准算法。该算法首先使用基于互信息的刚性配准算法对两幅待配准图像进行粗配;然后,在采样点上提取像素灰度和SIFT高维特征,并在此基础上构造k-最邻近图(kNNG);最后,使用k-最邻近图来估计α互信息(αMI)。实验结果表明:和传统的基于互信息和像素灰度的刚性配准算法,基于熵图估计和单一像素灰度特征的非刚性配准算法相比,本文提出的算法具有更高的配准准确性。 展开更多
关键词 医学图像配准 SIFT描述子 k-最邻近 α互信息
原文传递
基于KNN的中文文本分类反馈学习研究 被引量:3
16
作者 刘怀亮 张治国 +1 位作者 马志辉 赵捧未 《图书情报工作》 CSSCI 北大核心 2008年第10期101-104,共4页
依据KNN分类算法和反馈学习的思想,在分析中文文本分类过程的基础上,给出基于反馈学习的中文文本分类模型和基于KNN的中文文本分类反馈学习过程。通过实验研究反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习是实时变化信息... 依据KNN分类算法和反馈学习的思想,在分析中文文本分类过程的基础上,给出基于反馈学习的中文文本分类模型和基于KNN的中文文本分类反馈学习过程。通过实验研究反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习是实时变化信息的一种有效的学习方法,它对训练不充分的文本分类器具有很大的改善作用。 展开更多
关键词 k-最邻近反馈学习 中文文本分类 实证研究
原文传递
顾及最佳搜索邻域的三维激光扫描变形监测方法 被引量:3
17
作者 吴彩保 陈西江 吴浩 《武汉理工大学学报》 CAS 北大核心 2016年第9期72-76,97,共6页
为了满足三维激光扫描精准形变监测的需求,针对三维激光扫描点云数据处理的最邻近点搜索模型,提出了一种定量确定最佳搜索邻域的方法,并利用实际工程案例和现场模拟手段,通过联合实验加以验证。结果表明,该方法对利用三维激光扫描来提... 为了满足三维激光扫描精准形变监测的需求,针对三维激光扫描点云数据处理的最邻近点搜索模型,提出了一种定量确定最佳搜索邻域的方法,并利用实际工程案例和现场模拟手段,通过联合实验加以验证。结果表明,该方法对利用三维激光扫描来提取工程局部变形的准确性具有较大提高,有利于进一步发挥三维激光扫描技术在变形监测中的作用。 展开更多
关键词 边坡 监测 k-最邻近点搜索 邻近 三维激光扫描
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部