期刊文献+
共找到448篇文章
< 1 2 23 >
每页显示 20 50 100
LDA和KNN算法在随钻测井火成岩分类的应用
1
作者 方全全 曹军 +2 位作者 张国强 许吉俊 任宏 《石油工业技术监督》 2024年第4期17-20,共4页
渤中34-9油田在开发过程中广泛钻遇古近系火成岩,由于火成岩岩性多样、成分复杂导致常规测井解释图版识别岩性精度较差,而在随钻过程中准确识别火成岩岩性是工程上规避憋、卡、漏等风险的重要前提。通过将机器学习算法线性判别分析(LDA)... 渤中34-9油田在开发过程中广泛钻遇古近系火成岩,由于火成岩岩性多样、成分复杂导致常规测井解释图版识别岩性精度较差,而在随钻过程中准确识别火成岩岩性是工程上规避憋、卡、漏等风险的重要前提。通过将机器学习算法线性判别分析(LDA)与KNN算法运用于油田开发过程中的随钻测井数据处理与分析,实现了随钻过程中准确、高效识别火成岩岩性的目的。进一步将线性判别分析的降维结果代替原始测井曲线作为K最近邻分类器的输入,实现两种算法的有机融合,并对油田5口开发井建立的测井数据集进行机器学习,火成岩岩性分类准确率高于90%,证明了该方法的适用性。通过引入机器学习方法为常规录、测井数据的处理与解释提供了新方法,多方法的结合也为油田勘探作业过程中的分类提供借鉴。 展开更多
关键词 随钻测井 线性判别分析 knn算法 火成岩分类 渤中油田
下载PDF
基于PCA+KNN和kernal-PCA+KNN算法的废旧纺织物鉴别
2
作者 李宁宁 刘正东 +2 位作者 王海滨 韩熹 李文霞 《分析测试学报》 CAS CSCD 北大核心 2024年第7期1039-1045,共7页
该研究采集了15类废旧纺织物的4 998张近红外谱图,以7∶3的比例分为训练集和验证集,并分别采用主成分分析(PCA)与核主成分分析(kernal-PCA)两种不同降维方法对数据进行降维,并选用余弦相似度(cosine)核作为kernal-PCA的最佳核函数,最后... 该研究采集了15类废旧纺织物的4 998张近红外谱图,以7∶3的比例分为训练集和验证集,并分别采用主成分分析(PCA)与核主成分分析(kernal-PCA)两种不同降维方法对数据进行降维,并选用余弦相似度(cosine)核作为kernal-PCA的最佳核函数,最后分别将PCA和kernal-PCA降维处理后的数据进行k-近邻算法(KNN)训练。结果表明,kernal-PCA+KNN的模型准确率(95.17%)优于PCA+KNN模型的准确率(92.34%)。研究表明,kernal-PCA+KNN算法可以实现15类废旧纺织物识别准确率的提升,为废旧纺织物在线近红外自动分拣提供有力的技术支撑。 展开更多
关键词 废旧纺织物 主成分分析(PCA) 核主成分分析(kernel-PCA) k-近邻算法(knn) 分类识别
下载PDF
基于量子K近邻分类算法的软件应用层接口数据分析方法
3
作者 韩亦睿 《软件》 2024年第7期59-61,共3页
由于软件应用层接口数据的分布具有星散分布的特点,因此,分析数据判断接口状态时,对应的可靠性难以得到保障。为此,本文提出基于量子K近邻分类算法的软件应用层接口数据分析方法。将接口数据的特征映射到量子比特后,使用量子态编码具体... 由于软件应用层接口数据的分布具有星散分布的特点,因此,分析数据判断接口状态时,对应的可靠性难以得到保障。为此,本文提出基于量子K近邻分类算法的软件应用层接口数据分析方法。将接口数据的特征映射到量子比特后,使用量子态编码具体的接口数据。在分析阶段,采用交叉验证的方式确定最佳K值,并选择曼哈顿距离作为衡量数据点之间相似性的基准,设置分类中心为软件应用层接口数据分析的目标状态参数,根据量子化软件应用层接口数据与状态分类中心的距离,完成数据分析。测试结果表明,设计方法对于软件应用层接口状态的分析结果与监测值具有较高的拟合度。 展开更多
关键词 量子k近邻分类算法 软件应用层接口数据 量子比特 k
下载PDF
基于KNN算法在糖尿病预测中的应用
4
作者 梅俊 陈建敏 《电脑与信息技术》 2024年第1期7-9,共3页
人工智能技术在海量医疗数据中,通过技术手段实现疾病预测,为辅助治疗提供重要依据。文章分析了机器分类算法KNN算法的流程,以及在糖尿病数据中的具体实例。通过划分糖尿病数据集,计算KNN算法中的K值,确定选取最佳k值,达到最优准确率。... 人工智能技术在海量医疗数据中,通过技术手段实现疾病预测,为辅助治疗提供重要依据。文章分析了机器分类算法KNN算法的流程,以及在糖尿病数据中的具体实例。通过划分糖尿病数据集,计算KNN算法中的K值,确定选取最佳k值,达到最优准确率。通过实验验证KNN算法在糖尿病数据集上,该模型进行糖尿病预测有效。 展开更多
关键词 knn算法 糖尿病预测 人工智能 数据集 k
下载PDF
一种基于K近邻算法的图书馆读者分类方法
5
作者 张佩 《科学与信息化》 2024年第15期23-25,共3页
在进行读者类型分类时,针对某一待分类读者,存在分类交叉的情况,从而难以分类。在对27位读者进行问卷调查获取读者样本数据的基础上,文章提出了采用K邻近(KNN)算法对读者进行分类的方法,详细阐述了算法分类过程,并进行实例结果分析。通... 在进行读者类型分类时,针对某一待分类读者,存在分类交叉的情况,从而难以分类。在对27位读者进行问卷调查获取读者样本数据的基础上,文章提出了采用K邻近(KNN)算法对读者进行分类的方法,详细阐述了算法分类过程,并进行实例结果分析。通过分析,该方法能够有效克服读者分类交叉的情况,分类过程易于操作,分类结果科学合理,为图书馆提高服务质量和读者满意度等工作提供参考依据。 展开更多
关键词 读者类型分类 分类交叉 knn算法 问卷调查
下载PDF
二进制鼠群优化算法的特征选择及数据分类
6
作者 鲍美英 申晋祥 《计算机与数字工程》 2024年第6期1612-1616,1675,共6页
针对特征选择技术中提高分类准确率和降低特征选取个数随着数据维度增加而难度加大的问题,对新型仿生优化算法的鼠群优化算法进行改进,在算法中引入转换函数,使用K近邻法作为分类器,提出二进制鼠群优化算法,用于特征选择,进行数据分类,... 针对特征选择技术中提高分类准确率和降低特征选取个数随着数据维度增加而难度加大的问题,对新型仿生优化算法的鼠群优化算法进行改进,在算法中引入转换函数,使用K近邻法作为分类器,提出二进制鼠群优化算法,用于特征选择,进行数据分类,对特征进行有效的降维并减少数据分类的错误率。在UCI的10个数据集上进行测试,并与遗传算法、粒子群算法、樽海鞘群算法和正余弦算法进行比较,实验结果表明,所提算法能够提高数据分类准确率并有效降低特征维度,算法具有较好的收敛性和鲁棒性。 展开更多
关键词 鼠群优化算法 特征选择 数据分类 k近邻
下载PDF
基于改进KNN的不均衡信息文本分类算法
7
作者 马召贵 《信息与电脑》 2023年第12期85-87,共3页
针对常规文本分类算法存在文本特征提取不全面的问题,提出基于改进K近邻(K-Nearest Neighbor,KNN)的不均衡信息文本分类算法。首先,通过文本分词与去停用词两个步骤,对不均衡信息文本进行预处理,避免无用数据对分类结果产生干扰。其次,... 针对常规文本分类算法存在文本特征提取不全面的问题,提出基于改进K近邻(K-Nearest Neighbor,KNN)的不均衡信息文本分类算法。首先,通过文本分词与去停用词两个步骤,对不均衡信息文本进行预处理,避免无用数据对分类结果产生干扰。其次,利用互信息特征提取方法,提取不均衡信息文本特征,获取文本特征词与类别之间的相关程度。最后,利用改进KNN原理对待测不均衡信息文本数据进行邻近聚类,设计文本分类算法。实验结果表明,该算法的分类查准率始终在98%以上,优于对照组。 展开更多
关键词 k近邻(knn) 不均衡 信息文本 分类算法
下载PDF
坝肩岩体质量LDA-KNN分类模型
8
作者 荀鹏 李娟 +2 位作者 魏玉峰 李常虎 范文东 《成都理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期281-290,302,共11页
工程岩体质量分级评价对工程的安全、设计、经济效益等有重要影响。针对当前岩级划分方法中存在不确定性,人为因素干扰和忽视了传统定性分级中对岩体质量评价的重要性等问题,本文通过在工程实际中搜集样本建立数据库,从工程的实际需求出... 工程岩体质量分级评价对工程的安全、设计、经济效益等有重要影响。针对当前岩级划分方法中存在不确定性,人为因素干扰和忽视了传统定性分级中对岩体质量评价的重要性等问题,本文通过在工程实际中搜集样本建立数据库,从工程的实际需求出发,选择岩体完整性系数(K v)、结构面间距(D)、岩石质量指标(RQD)等合适的评价指标,通过引入LDA(Linear Discriminant Analysis)降维方法和K近邻分析(K-Nearest-Neighbor,KNN)相结合的多分类模型,实现了岩体的非线性分级预测。通过定性定量相结合实现了岩体多因素,多指标的综合分级,并解决了多指标判断时信息冗余,复杂程度高的问题。与其他判别方案相比较,模型得出的结果准确率高,符合工程实际,减少了人为因素的影响,体现出较强的预测判别能力。该研究为水电站大坝坝肩处的平硐岩体质量划分提出了一种可行的预测方案。 展开更多
关键词 岩体结构 岩体质量分级 线性降维 k近邻算法 分类模型
下载PDF
基于机器学习分类算法解析EIS数据的有机涂层性能评价方法
9
作者 纪皓迪 马小兵 《装备环境工程》 CAS 2024年第5期142-149,共8页
目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过... 目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过对比支持向量机(SVM)、k最近邻(k-NN)和随机森林(RF)3种不同的机器学习算法,以及多种输入特征集训练的涂层性能分类器模型的准确率,分析最适合用于涂层性能快速评估的机器学习算法和电化学特征。结果根据不同输入特征训练的k-NN和RF模型均表现出良好的预测效果,而SVM模型的预测效果相对较差。根据不同频率范围训练的分类器模型中,在低频区表现最佳,而在高频区表现较差。结论基于阻抗虚部、虚部+实部和阻抗模值3种输入特征训练的RF分类器模型的预测效果最准确。不同频率区间内,低频区的阻抗特征更能准确表征涂层性能。 展开更多
关键词 有机涂层 分类算法 机器学习 电化学阻抗谱 支持向量机 k最近邻 随机森林
下载PDF
面向申威架构的KNN并行算法实现与优化 被引量:3
10
作者 王其涵 庞建民 +3 位作者 岳峰 祝迪 沈莉 肖谦 《计算机工程》 CAS CSCD 北大核心 2023年第5期286-294,共9页
K近邻(KNN)是人工智能中最常用的分类算法,其性能提升对于海量数据的整理分析、大数据分类等任务具有重要意义。目前新一代神威超级计算机正处于应用发展的初始阶段,结合新一代申威异构众核处理器的结构特性,充分利用庞大的计算资源实... K近邻(KNN)是人工智能中最常用的分类算法,其性能提升对于海量数据的整理分析、大数据分类等任务具有重要意义。目前新一代神威超级计算机正处于应用发展的初始阶段,结合新一代申威异构众核处理器的结构特性,充分利用庞大的计算资源实现高效的KNN算法是海量数据分析整理的现实需求。根据SW26010pro处理器的结构特性,采用主从加速编程模型实现一种基础版本的KNN并行算法,其将计算核心传输到从核上,实现了线程级并行。分析影响基础并行算法性能的关键因素并提出优化算法SWKNN,不同于基础并行KNN算法的任务划分方式,SWKNN采用任务重划分策略,以避免冗余计算开销。通过数据流水优化、从核间通信优化、二次负载均衡优化等步骤减少不必要的通信开销,从而有效缓解访存压力并进一步提升算法性能。实验结果表明,与串行KNN算法相比,面向申威架构的基础并行KNN算法在SW26010pro处理器的单核组上可以获得最高48倍的加速效果,在同等数据规模下,SWKNN算法较基础并行KNN算法又可以获得最高399倍的加速效果。 展开更多
关键词 异构众核处理器 k近邻算法 并行计算 算法优化 分类性能
下载PDF
改进型加权KNN算法的不平衡数据集分类 被引量:26
11
作者 王超学 潘正茂 +2 位作者 马春森 董丽丽 张涛 《计算机工程》 CAS CSCD 2012年第20期160-163,168,共5页
K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚... K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚类,按照权重分配模型计算各训练样本的权重,通过改进的KNN算法对测试样本进行分类。基于UCI数据集的大量实验结果表明,GAK-KNN算法的识别率和整体性能都优于传统KNN算法及其他改进算法。 展开更多
关键词 不平衡数据集 分类 k最邻近算法 权重分配模型 遗传算法 k-MEANS算法
下载PDF
应用特征聚合进行中文文本分类的改进KNN算法 被引量:60
12
作者 张晓辉 李莹 +1 位作者 王华勇 赵宏 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第3期229-232,共4页
针对以KNN为代表的VSM模型存在的向量各特征项孤立处理问题 ,提出了一种应用特征聚合方式的改进算法·该算法通过CHI概率统计计算文本特征词对分类的贡献 ,将对分类有相同贡献的文本特征词聚合 ,使用它们共同的分类贡献模式代替传... 针对以KNN为代表的VSM模型存在的向量各特征项孤立处理问题 ,提出了一种应用特征聚合方式的改进算法·该算法通过CHI概率统计计算文本特征词对分类的贡献 ,将对分类有相同贡献的文本特征词聚合 ,使用它们共同的分类贡献模式代替传统算法中单个词对应向量一维的方式·该算法提高了稀有词对分类的贡献、强化了关联词的分类效果、并降低了文本向量的维数·与传统KNN算法进行的对比实验证明 。 展开更多
关键词 改进knn算法 中文文本分类 分类贡献模式 特征聚合
下载PDF
使用KNN算法的文本分类 被引量:98
13
作者 张宁 贾自艳 史忠植 《计算机工程》 EI CAS CSCD 北大核心 2005年第8期171-172,185,共3页
介绍了数据挖掘的一个分枝——文本自动分类的相关技术,在对数据进行预处理的基础上,实现了K最近邻居分类算法,并结合实验结果对数据预处理在文本分类中的重要性进行了讨论。
关键词 数据挖掘 文本分类 knn算法 向量空间模型
下载PDF
基于并行权重自适应k-邻域算法的图像分类方法 被引量:1
14
作者 苗水清 闫文耀 吴梦蝶 《贵州师范大学学报(自然科学版)》 CAS 2023年第2期113-120,共8页
针对现有KNN算法识别率低的问题,提出了一种并行权重自适应k-邻域算法。该方法首先结合多线程技术,并采用分类组合的多个KNN单元进行识别以提高执行效率;其次在分类组合KNN算法中采用深度学习模型对各个类别进行了系数权重自适应设定,... 针对现有KNN算法识别率低的问题,提出了一种并行权重自适应k-邻域算法。该方法首先结合多线程技术,并采用分类组合的多个KNN单元进行识别以提高执行效率;其次在分类组合KNN算法中采用深度学习模型对各个类别进行了系数权重自适应设定,进而降低传统KNN和分类组合KNN,由于单纯类别个数的多少进行决策或者通过人为设定类别比例进行决策而引起的分类误差。通过在Fashion MNIST手写数据集进行实验,结果表明:该算法将传统的KNN算法分类正确率提高到97%左右,对实际应用具有一定的价值。 展开更多
关键词 并行权重自适应 k-邻域算法 深度学习 knn 图像分类
下载PDF
基于k-最近邻图的小样本KNN分类算法 被引量:27
15
作者 刘应东 牛惠民 《计算机工程》 CAS CSCD 北大核心 2011年第9期198-200,共3页
提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对... 提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对象进行类别标识。采用标准数据集进行测试,结果表明该算法在小样本情况下能够提高KNN的分类精度,减小最近邻阈值k对分类效果的影响。 展开更多
关键词 knn算法 k-最近邻图 小样本 图划分 分类算法
下载PDF
基于KNN算法的文本自动分类方法研究——以学术期刊栏目自动归类为例 被引量:7
16
作者 李湘东 徐朋 +1 位作者 黄莉 沈祥兴 《图书情报知识》 CSSCI 北大核心 2010年第4期71-76,共6页
本文将期刊目录中按照主题设置的有关栏目(常设主题栏目)看作不同的类别,应用改进的KNN算法对属于不同类别(栏目)的期刊论文进行自动归类(归栏)处理。在分析期刊常设主题栏目特征的基础之上,从建立自动分类所需的训练文本集、测试集及分... 本文将期刊目录中按照主题设置的有关栏目(常设主题栏目)看作不同的类别,应用改进的KNN算法对属于不同类别(栏目)的期刊论文进行自动归类(归栏)处理。在分析期刊常设主题栏目特征的基础之上,从建立自动分类所需的训练文本集、测试集及分类(归栏)效果评价等多个方面加以定义,利用Jensen-shannon散度计算文本间的相似度,按照栏目动态决定k值等方面对KNN算法的基本原理加以改进。该方法以论文标题、摘要和作者关键词构成的短小文本为分类对象,对期刊常设主题栏目的自动归类(归栏)处理取得77.25%的F测度值,可以针对短小文本以及训练文本数量有限的情况下开展有效的文本自动分类处理。 展开更多
关键词 knn算法 自动归类 栏目 Jensen—Shannon散度 动态k
下载PDF
基于测井曲线斜率的KNN分类算法常规测井裂缝识别——以普光气田礁滩相储层为例 被引量:9
17
作者 何胡军 毕建霞 +1 位作者 曾大乾 王秋语 《中外能源》 CAS 2014年第1期70-74,共5页
常规测井相对岩心和成像测井来说,具有普遍性和经济性,在裂缝识别研究过程中具有岩心和成像测井不可替代的作用。如何利用常规测井资料对裂缝进行有效识别,特别是对于储层物性好、裂缝发育的边水油(气)藏,是防止边水顺裂缝突进、保障油(... 常规测井相对岩心和成像测井来说,具有普遍性和经济性,在裂缝识别研究过程中具有岩心和成像测井不可替代的作用。如何利用常规测井资料对裂缝进行有效识别,特别是对于储层物性好、裂缝发育的边水油(气)藏,是防止边水顺裂缝突进、保障油(气)藏高效开发的关键。以普光气田长兴组和飞仙关组岩心裂缝观察为基础,从裂缝测井响应原理出发,提出对测井曲线求斜率,放大裂缝测井响应特征的方法,并利用对类域的交叉或重叠较多的待分样本集具有较好分类作用的KNN分类算法,进行裂缝识别。通过对普光气田礁滩相储层裂缝常规测井识别的运用,证实该思路对储层物性好、裂缝和孔隙同时发育的双重孔隙介质储层的有效裂缝和无效裂缝具有很好的识别效果,常规测井识别结果和岩心观察裂缝识别结果之间具有很高的吻合性。 展开更多
关键词 裂缝识别 knn分类算法 测井曲线斜率 礁滩相储层
下载PDF
基于粒子群优化的快速KNN分类算法 被引量:8
18
作者 张国英 沙芸 江慧娜 《山东大学学报(理学版)》 CAS CSCD 北大核心 2006年第3期120-123,共4页
提出了一种有效的快速k近邻分类文本分类算法,即PSOKNN算法,该算法利用粒子群优化方法的随机搜索能力在训练文档集中进行有指导的全局随机搜索.在搜索k近邻的过程中,粒子群跳跃式移动,掠过大量不可能成为k近邻的文档向量,从而可以快速... 提出了一种有效的快速k近邻分类文本分类算法,即PSOKNN算法,该算法利用粒子群优化方法的随机搜索能力在训练文档集中进行有指导的全局随机搜索.在搜索k近邻的过程中,粒子群跳跃式移动,掠过大量不可能成为k近邻的文档向量,从而可以快速找到测试样本的k个近邻.以Reuters-21578文档集分类为例验证算法的有效性,结果表明,保持k近邻法分类精度,新算法比KNN算法降低分类时间70%. 展开更多
关键词 knn分类 粒子群优化算法 文本分类 文本相似度
下载PDF
用于文本分类的改进KNN算法 被引量:6
19
作者 王煜 张明 +1 位作者 王正欧 白石 《计算机工程与应用》 CSCD 北大核心 2007年第13期159-162,166,共5页
采用灵敏度方法对距离公式中文本特征的权重进行修正;提出一种基于CURE算法和Tabu算法的训练样本库的裁减方法,采用CURE聚类算法获得每个聚类的代表样本组成新的训练样本集合,然后用Tabu算法对此样本集合进行进一步维护(添加或删除样本)... 采用灵敏度方法对距离公式中文本特征的权重进行修正;提出一种基于CURE算法和Tabu算法的训练样本库的裁减方法,采用CURE聚类算法获得每个聚类的代表样本组成新的训练样本集合,然后用Tabu算法对此样本集合进行进一步维护(添加或删除样本),添加样本时只考虑增加不同类交界处的样本,添加或删除样本以分类精度最高、与原始训练样本库距离最近为原则。 展开更多
关键词 文本分类 knn算法 灵敏度法 CURE聚类算法 TABU算法
下载PDF
基于区域划分的kNN文本快速分类算法研究 被引量:23
20
作者 胡元 石冰 《计算机科学》 CSCD 北大核心 2012年第10期182-186,共5页
kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中广泛应用。为提高其分类效率,提出一种基于区域划分的kNN文本快速分类算法。将训练样本集按空间分布情况划分成若干区域,根据测试样本与各区域之间的位置关系快速查找其k个最... kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中广泛应用。为提高其分类效率,提出一种基于区域划分的kNN文本快速分类算法。将训练样本集按空间分布情况划分成若干区域,根据测试样本与各区域之间的位置关系快速查找其k个最近邻,从而大大降低kNN算法的计算量。数学推理和实验结果均表明,该算法在确保kNN分类器准确率不变的前提下,显著提高了分类效率。 展开更多
关键词 文本分类 knn算法 聚类 k-均值算法
下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部