期刊文献+
共找到476篇文章
< 1 2 24 >
每页显示 20 50 100
A Pattern Classification Model for Vowel Data Using Fuzzy Nearest Neighbor
1
作者 Monika Khandelwal Ranjeet Kumar Rout +4 位作者 Saiyed Umer Kshira Sagar Sahoo NZ Jhanjhi Mohammad Shorfuzzaman Mehedi Masud 《Intelligent Automation & Soft Computing》 SCIE 2023年第3期3587-3598,共12页
Classification of the patterns is a crucial structure of research and applications. Using fuzzy set theory, classifying the patterns has become of great interest because of its ability to understand the parameters. ... Classification of the patterns is a crucial structure of research and applications. Using fuzzy set theory, classifying the patterns has become of great interest because of its ability to understand the parameters. One of the problemsobserved in the fuzzification of an unknown pattern is that importance is givenonly to the known patterns but not to their features. In contrast, features of thepatterns play an essential role when their respective patterns overlap. In this paper,an optimal fuzzy nearest neighbor model has been introduced in which a fuzzifi-cation process has been carried out for the unknown pattern using k nearest neighbor. With the help of the fuzzification process, the membership matrix has beenformed. In this membership matrix, fuzzification has been carried out of the features of the unknown pattern. Classification results are verified on a completelyllabelled Telugu vowel data set, and the accuracy is compared with the differentmodels and the fuzzy k nearest neighbor algorithm. The proposed model gives84.86% accuracy on 50% training data set and 89.35% accuracy on 80% trainingdata set. The proposed classifier learns well enough with a small amount of training data, resulting in an efficient and faster approach. 展开更多
关键词 nearest neighbors fuzzy classification patterns recognition reasoning rule membership matrix
下载PDF
Pruned fuzzy K-nearest neighbor classifier for beat classification 被引量:2
2
作者 Muhammad Arif Muhammad Usman Akram Fayyaz-ul-Afsar Amir Minhas 《Journal of Biomedical Science and Engineering》 2010年第4期380-389,共10页
Arrhythmia beat classification is an active area of research in ECG based clinical decision support systems. In this paper, Pruned Fuzzy K-nearest neighbor (PFKNN) classifier is proposed to classify six types of beats... Arrhythmia beat classification is an active area of research in ECG based clinical decision support systems. In this paper, Pruned Fuzzy K-nearest neighbor (PFKNN) classifier is proposed to classify six types of beats present in the MIT-BIH Arrhythmia database. We have tested our classifier on ~ 103100 beats for six beat types present in the database. Fuzzy KNN (FKNN) can be implemented very easily but large number of training examples used for classification can be very time consuming and requires large storage space. Hence, we have proposed a time efficient Arif-Fayyaz pruning algorithm especially suitable for FKNN which can maintain good classification accuracy with appropriate retained ratio of training data. By using Arif-Fayyaz pruning algorithm with Fuzzy KNN, we have achieved a beat classification accuracy of 97% and geometric mean of sensitivity of 94.5% with only 19% of the total training examples. The accuracy and sensitivity is comparable to FKNN when all the training data is used. Principal Component Analysis is used to further reduce the dimension of feature space from eleven to six without compromising the accuracy and sensitivity. PFKNN was found to robust against noise present in the ECG data. 展开更多
关键词 ARRHYTHMIA ECG K-nearest neighbor PRUNING FUZZY classification
下载PDF
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 被引量:1
3
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《Journal of Data Analysis and Information Processing》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 classification Algorithms NON-PARAMETRIC K-nearest-neighbor Neural Networks Random Forest Support Vector Machines
下载PDF
A Representation-Based Pseudo Nearest Neighbor Classifier
4
作者 Yanwei Qi 《国际计算机前沿大会会议论文集》 2018年第1期13-13,共1页
下载PDF
基于组合加权k近邻分类的无线传感网络节点复制攻击检测方法
5
作者 赵晓峰 王平水 《传感技术学报》 CAS CSCD 北大核心 2024年第6期1056-1060,共5页
无线传感网络节点体积小,隐蔽性强,节点复制攻击检测的难度较大,为此提出一种基于组合加权k近邻分类的无线传感网络节点复制攻击检测方法。通过信标节点的空间位置数据与相距跳数得出各节点之间的相似程度,结合高斯径向基核函数求解未... 无线传感网络节点体积小,隐蔽性强,节点复制攻击检测的难度较大,为此提出一种基于组合加权k近邻分类的无线传感网络节点复制攻击检测方法。通过信标节点的空间位置数据与相距跳数得出各节点之间的相似程度,结合高斯径向基核函数求解未知节点的横轴、纵轴的空间坐标,确定各网络节点的空间位置;根据网络节点的属性特征与投票机制建立节点复制攻击模型,凭借组合加权k近邻分类法划分节点类型,并将结果传送至簇头节点,由簇头节点做出最后的仲裁,识别出节点复制攻击行为。仿真结果表明,所提方法的节点复制攻击检测率最大值为99.5%,最小值为97.9%,对节点复制攻击检测的耗时为5.41 s,通信开销数据包数量最大值为209个,最小值为81个。 展开更多
关键词 无线传感网络 攻击检测 组合加权k近邻分类 复制节点 部署区域 信标节点
下载PDF
坝肩岩体质量LDA-KNN分类模型 被引量:1
6
作者 荀鹏 李娟 +2 位作者 魏玉峰 李常虎 范文东 《成都理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期281-290,302,共11页
工程岩体质量分级评价对工程的安全、设计、经济效益等有重要影响。针对当前岩级划分方法中存在不确定性,人为因素干扰和忽视了传统定性分级中对岩体质量评价的重要性等问题,本文通过在工程实际中搜集样本建立数据库,从工程的实际需求出... 工程岩体质量分级评价对工程的安全、设计、经济效益等有重要影响。针对当前岩级划分方法中存在不确定性,人为因素干扰和忽视了传统定性分级中对岩体质量评价的重要性等问题,本文通过在工程实际中搜集样本建立数据库,从工程的实际需求出发,选择岩体完整性系数(K v)、结构面间距(D)、岩石质量指标(RQD)等合适的评价指标,通过引入LDA(Linear Discriminant Analysis)降维方法和K近邻分析(K-Nearest-Neighbor,KNN)相结合的多分类模型,实现了岩体的非线性分级预测。通过定性定量相结合实现了岩体多因素,多指标的综合分级,并解决了多指标判断时信息冗余,复杂程度高的问题。与其他判别方案相比较,模型得出的结果准确率高,符合工程实际,减少了人为因素的影响,体现出较强的预测判别能力。该研究为水电站大坝坝肩处的平硐岩体质量划分提出了一种可行的预测方案。 展开更多
关键词 岩体结构 岩体质量分级 线性降维 K近邻算法 分类模型
下载PDF
基于LCD和KNNCH分类算法的齿轮故障诊断方法 被引量:10
7
作者 曾鸣 杨宇 +1 位作者 郑近德 程军圣 《中国机械工程》 EI CAS CSCD 北大核心 2014年第15期2049-2054,共6页
提出了一种基于局部特征尺度分解(LCD)和核最近邻凸包(KNNCH)分类算法的齿轮故障诊断方法。该方法采用LCD对齿轮原始振动信号进行分解得到若干内禀尺度分量(ISC),然后提取包含主要信息的ISC分量的能量作为特征向量输入到KNNCH分类器,根... 提出了一种基于局部特征尺度分解(LCD)和核最近邻凸包(KNNCH)分类算法的齿轮故障诊断方法。该方法采用LCD对齿轮原始振动信号进行分解得到若干内禀尺度分量(ISC),然后提取包含主要信息的ISC分量的能量作为特征向量输入到KNNCH分类器,根据其输出结果来判断齿轮的工作状态。实验分析结果表明,所提出的方法能有效地提取齿轮故障特征信息,而且在小样本的情况下仍能准确地对齿轮的工作状态进行识别。同时,与支持向量机(SVM)算法的对比分析结果表明,KNNCH算法能取得与SVM算法相当或更高的正确识别率。 展开更多
关键词 局部特征尺度分解(LCD) 核最近邻凸包(KnncH)分类算法 能量 齿轮 故障诊断
下载PDF
基于图像识别的公路隧道围岩智能动态分级研究
8
作者 周梦琳 陈强 +3 位作者 汪波 宋自愿 彭传阳 程黎 《隧道建设(中英文)》 CSCD 北大核心 2024年第6期1274-1282,共9页
针对勘察设计阶段判别的隧道围岩等级与施工过程中实际揭露的围岩情况不符的问题,提出一种以隧道施工期实际揭露的围岩为研究对象的智能动态分级方法。首先,依托甘肃省渭武高速公路木寨岭隧道工程,利用单反相机采集掌子面图像,基于深度... 针对勘察设计阶段判别的隧道围岩等级与施工过程中实际揭露的围岩情况不符的问题,提出一种以隧道施工期实际揭露的围岩为研究对象的智能动态分级方法。首先,依托甘肃省渭武高速公路木寨岭隧道工程,利用单反相机采集掌子面图像,基于深度学习Res Net18网络设计T-Res Net模型,进行掌子面围岩图像特征定性识别分类;然后,利用数字图像处理技术定量识别、提取节理裂隙特征参数,进而确定掌子面完整性指标;最后,结合岩石坚硬程度、岩体完整程度、主结构面产状、地下水发育状况、初始地应力、节理延展性6个指标建立围岩分级指标体系,并采用特征加权KNN(K-nearest neighbor)算法模型实现隧道围岩智能动态分级。研究结果表明:1)T-Res Net模型在节理裂隙测试集的准确率达到83.23%,在地下水测试集的准确率达到92.86%,可以实现围岩特征的有效识别与精确分类;2)使用机器视觉方法处理现场围岩图像,可快速提取岩体完整性系数和地下水发育情况,实现现场智能化高效分析;3)KNN智能动态分级方法在依托工程具有良好的适用性和较高的准确性,可有效实现隧道施工过程中的围岩动态分级。 展开更多
关键词 公路隧道 深度学习 数字图像处理 KNN算法 围岩分级
下载PDF
基于近邻卷积神经网络的油画分类方法研究
9
作者 钱华 祁枢杰 +2 位作者 顾涔 陶然 吴宏杰 《苏州科技大学学报(自然科学版)》 CAS 2024年第1期69-75,共7页
油画分类是油画生成、油画识别及数字油画应用的重要基础工作。但由于油画图片与普通图片存在较大的质感差异,而且是油画家的个性化创作,不确定性更高,较普通照片的分类更困难。论文以分类出含有桥梁的油画为例,提出一种基于近邻卷积神... 油画分类是油画生成、油画识别及数字油画应用的重要基础工作。但由于油画图片与普通图片存在较大的质感差异,而且是油画家的个性化创作,不确定性更高,较普通照片的分类更困难。论文以分类出含有桥梁的油画为例,提出一种基于近邻卷积神经网络的油画分类方法,利用K最近邻分类算法提取与测试样本最接近的K个训练样本,卷积神经网络挖掘油画中的深层特征,从而对油画中的对象进行分类。论文详细讨论了数据处理、卷积神经网络的架构设计、训练过程。并在kaggle数据集上对该方法进行了分析与比较,使用三个数据集进行实验,实验结果表明该方法较最近邻算法精度上平均提高了2.4%,较卷积神经网络精度上平均提高了3.1%,较支持向量机方法精度上平均提高了6.9%。 展开更多
关键词 卷积神经网络 K最近邻分类算法 数据可视化 图像分类
下载PDF
基于样本势和噪声进化的不平衡数据过采样方法
10
作者 冷强奎 孙薛梓 孟祥福 《计算机应用》 CSCD 北大核心 2024年第8期2466-2475,共10页
在处理不平衡数据分类问题中,过采样方法是一种有效的策略。现有方法大多采用K近邻(KNN)技术选取采样种子样本,但KNN参数值的改变会导致多数过采样方法表现出明显的不适定性。径向基过采样(RBO)方法能解决这个问题,但在采样后易出现大... 在处理不平衡数据分类问题中,过采样方法是一种有效的策略。现有方法大多采用K近邻(KNN)技术选取采样种子样本,但KNN参数值的改变会导致多数过采样方法表现出明显的不适定性。径向基过采样(RBO)方法能解决这个问题,但在采样后易出现大量噪声。基于此,提出一种基于样本势和噪声进化的不平衡数据过采样方法,进一步对采样后的数据集迭代进化。首先,使用RBO方法通过计算样本势合成少数类样本,并改善原始数据的不平衡;其次,使用自然近邻(NaN)作为错误检测技术检测过采样后数据集中存在的疑似噪声样本;最后,利用改进的差分进化(DE)方法对检测出的疑似噪声样本迭代进化。相较于传统过采样方法,所提方法能更充分挖掘数据集中的重要边界信息,从而为分类器提供更多辅助以改善其分类性能。在22个基准数据集上,与7种经典采样方法(结合3种不同分类器)进行了大量对比实验。实验结果表明,所提方法具有更高的F1值和G-mean值,并且在噪声处理方面也优于带有后置过滤器的采样方法,可以更有效地解决不平衡数据分类问题。此外,统计分析也表明它的弗里德曼排名更高。 展开更多
关键词 K近邻 径向基过采样 样本势 自然近邻 差分进化 不平衡数据分类
下载PDF
基于函数型k近邻分类模型的PM2.5研究
11
作者 刘壮 凌能祥 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第7期967-970,共4页
文章利用函数型数据分析方法,选取每天24 h的温度数据作为一条独立的曲线样本,并在该基础上建立函数型k近邻分类模型,用以对当天的24 h平均PM_(2.5)质量浓度进行分类判别。分别选取二次型核函数、指数型核函数、三角型核函数建立k近邻... 文章利用函数型数据分析方法,选取每天24 h的温度数据作为一条独立的曲线样本,并在该基础上建立函数型k近邻分类模型,用以对当天的24 h平均PM_(2.5)质量浓度进行分类判别。分别选取二次型核函数、指数型核函数、三角型核函数建立k近邻分类模型,并对其结果进行分析,通过对比发现,利用三角型核函数的k近邻分类模型对PM_(2.5)质量浓度进行分类的准确性最高且最稳健。采用NW(Nadaraya-Watson)核方法与k近邻分类模型进行比较分析,结果表明,k近邻分类模型能有效提高分类的准确率。 展开更多
关键词 函数型数据分类 K近邻 核函数 非参数统计
下载PDF
数字报版面布局自动生成方法 被引量:1
12
作者 曾振宇 程雨夏 +3 位作者 陶颖 何兴臻 廖鹏飞 庄跃辉 《智能系统学报》 CSCD 北大核心 2024年第3期679-688,共10页
报纸版面对新闻有一个价值排序合理且美观新颖的展示,让读者面对众多新闻,在短时间获取最具价值的讯息和浏览乐趣。然而,对于排版人员而言,手动制作美观易读的报纸版面布局需耗费大量时间成本。本文结合贝叶斯网络推断和约束规划技术,... 报纸版面对新闻有一个价值排序合理且美观新颖的展示,让读者面对众多新闻,在短时间获取最具价值的讯息和浏览乐趣。然而,对于排版人员而言,手动制作美观易读的报纸版面布局需耗费大量时间成本。本文结合贝叶斯网络推断和约束规划技术,提出一种数字报版面布局自动生成方法。该方法首先基于历史版面数据驱动和专家经验对数字报版面的结构和属性建立推断模型,使得新生成的版面具有历史特定风格;然后利用推断结果建立混合整数约束规划模型计算版面布局,从而显著减少模型求解空间,提高布局质量。此外,推断模型提供多种可用候选结构为生成结果提供多样性,规划模型具有良好的对齐性能。为了训练和验证模型,本文构建并公开了一个中文版面数据集,包括详细版面新闻属性标签数据。用户研究结果表明版面布局自动生成方法的有效性。 展开更多
关键词 贝叶斯网络 K近邻 整数规划 约束规划 二叉树 条件概率 分类 布局生成
下载PDF
基于字典分级和属性加权的密文排序检索方案
13
作者 王娟 努尔买买提·黑力力 《新疆大学学报(自然科学版中英文)》 CAS 2024年第2期246-256,共11页
可搜索加密支持用户在不解密原始数据的前提下对加密数据执行检索操作.现有的多关键词排序可搜索加密方案,其索引和陷门构建的时间成本通常依赖于由全局关键词字典张成的向量空间.为了减少用户端的计算开销和通信成本,进一步提升数据使... 可搜索加密支持用户在不解密原始数据的前提下对加密数据执行检索操作.现有的多关键词排序可搜索加密方案,其索引和陷门构建的时间成本通常依赖于由全局关键词字典张成的向量空间.为了减少用户端的计算开销和通信成本,进一步提升数据使用者对检索结果的满意度,提出了一种支持细粒度访问控制的多关键词密文排序检索方案.该方案首先设计基于互信息的字典剥离机制差异化全局字典中的关键词,得到两个信息量不同的附属子字典,进一步在低维子字典空间上生成索引和陷门;其次,引入文档访问策略中属性的权重,将其作为排序标准之一,使数据使用者获得更为相关的结果;最后,检索时利用筛选向量对数据进行初次过滤并借助属性匹配完成二次剔除,从而避免检索过程中不必要的计算. 展开更多
关键词 可搜索加密 多关键词排序检索 安全K-近邻算法 字典分级 属性加权
下载PDF
一种改进的局部均值伪近邻算法
14
作者 李毅 张德生 张晓 《计算机工程与应用》 CSCD 北大核心 2024年第5期88-94,共7页
针对基于局部均值的伪近邻分类算法(LMPNN)易受近邻参数k和噪声点影响的问题,提出了一种改进的局部均值伪近邻分类算法(IPLMPNN)。利用双层搜索规则确定待测样本的最近邻,提高近邻集的选择质量;为了克服主观赋权法的不利影响,并且加强... 针对基于局部均值的伪近邻分类算法(LMPNN)易受近邻参数k和噪声点影响的问题,提出了一种改进的局部均值伪近邻分类算法(IPLMPNN)。利用双层搜索规则确定待测样本的最近邻,提高近邻集的选择质量;为了克服主观赋权法的不利影响,并且加强每个局部均值向量对分类的作用,引入注意力机制计算距离加权系数;使用改进的调和平均距离计算待测样本与局部均值向量之间的加权多调和平均距离,由此查找伪近邻点对待测样本进行分类。利用UCI和KEEL中的多个数据集对IPLMPNN算法进行仿真实验,并与8种相关算法进行比较。实验结果表明,IPLMPNN算法取得了令人满意的分类结果。 展开更多
关键词 局部均值的伪近邻分类算法(LMPNN) 双层搜索 注意力机制 多调和平均距离
下载PDF
基于机器学习分类算法解析EIS数据的有机涂层性能评价方法
15
作者 纪皓迪 马小兵 《装备环境工程》 CAS 2024年第5期142-149,共8页
目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过... 目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过对比支持向量机(SVM)、k最近邻(k-NN)和随机森林(RF)3种不同的机器学习算法,以及多种输入特征集训练的涂层性能分类器模型的准确率,分析最适合用于涂层性能快速评估的机器学习算法和电化学特征。结果根据不同输入特征训练的k-NN和RF模型均表现出良好的预测效果,而SVM模型的预测效果相对较差。根据不同频率范围训练的分类器模型中,在低频区表现最佳,而在高频区表现较差。结论基于阻抗虚部、虚部+实部和阻抗模值3种输入特征训练的RF分类器模型的预测效果最准确。不同频率区间内,低频区的阻抗特征更能准确表征涂层性能。 展开更多
关键词 有机涂层 分类算法 机器学习 电化学阻抗谱 支持向量机 k最近邻 随机森林
下载PDF
基于机器学习的DNA序列分类研究
16
作者 保志康 陈继璇 +4 位作者 刘印晓 张茂源 章洪博 刘振安 魏晓娟 《生物化工》 CAS 2024年第3期20-27,共8页
DNA承载了生物体内的所有遗传信息,决定基因的结构和功能。对DNA所属类别进行预测,可以判断一个未知类是否为新物种、外来物种或者熟知物种。随着生物技术的发展,如何从获取到的DNA序列中提取完整信息并预测其序列组成,找到组成规律,准... DNA承载了生物体内的所有遗传信息,决定基因的结构和功能。对DNA所属类别进行预测,可以判断一个未知类是否为新物种、外来物种或者熟知物种。随着生物技术的发展,如何从获取到的DNA序列中提取完整信息并预测其序列组成,找到组成规律,准确反映物种特性成为生物信息学中的一个重要问题。本研究从NCBI网站上下载序列登录号为CP021707和CP085300的两类DNA序列文件,基于碱基频率和数量特征提取方法进行单碱基、双碱基和三碱基的特征提取,构建出84维、168维和35维特征向量,分别基于K近邻(K-Nearest Neighbor,KNN)、支持向量机(Support Vector Machine,SVM)以及K近邻和支持向量机融合(KNN-SVM)算法模型进行分类预测。实验结果表明,在168维特征向量下,基于KNN-SVM算法模型的分类准确率比基于KNN或SVM算法模型的分类准确率高,对判断一个未知类的相关特性具有积极意义。 展开更多
关键词 支持向量机 DNA序列 特征提取 K近邻 分类准确率
下载PDF
基于对比学习和注意力机制的文本分类方法
17
作者 钱来 赵卫伟 《计算机工程》 CAS CSCD 北大核心 2024年第7期104-111,共8页
文本分类作为自然语言处理领域的基本任务,在信息检索、机器翻译和情感分析等应用中发挥着重要作用。然而大多数深度模型在预测时未充分考虑训练实例的丰富信息,导致学到的文本特征不够全面。为了充分利用训练实例信息,提出一种基于对... 文本分类作为自然语言处理领域的基本任务,在信息检索、机器翻译和情感分析等应用中发挥着重要作用。然而大多数深度模型在预测时未充分考虑训练实例的丰富信息,导致学到的文本特征不够全面。为了充分利用训练实例信息,提出一种基于对比学习和注意力机制的文本分类方法。首先,设计一种有监督对比学习训练策略,旨在优化模型对文本向量表征的检索,提高模型在推理过程中检索到的训练实例的质量;然后,构建注意力机制,对获取的训练文本特征进行注意力分布学习,聚焦关联性更强的相邻实例信息,获得更多隐含的相似特征;最后,将注意力机制与模型网络相结合,融合相邻的训练实例信息,增强模型提取多样性特征的能力,实现全局特征和局部特征的提取。实验结果表明,所提方法在卷积神经网络(CNN)、双向长短期记忆网络(Bi LSTM)、图卷积网络(GCN)、BERT和Ro BERTa等多个模型上都取得了显著的性能提升。以CNN模型为例,其在THUCNews数据集、今日头条数据集和搜狗数据集上宏F1值分别提高了4.15、6.2和1.92个百分点。因此,该方法也为文本分类任务提供了一种有效的解决方案。 展开更多
关键词 文本分类 深度模型 对比学习 近似最近邻算法 注意力机制
下载PDF
基于动态自适应近邻算法的天波雷达RD图分类器设计
18
作者 罗忠涛 唐洪涛 +1 位作者 高天翱 曹健 《电讯技术》 北大核心 2024年第8期1315-1321,共7页
天波雷达的干扰检测问题可转化为距离-多普勒(Range-Doppler, RD)图像分类。在RD图分类器设计中,使用K近邻(K-Nearest Neighbor, KNN)算法时,k值的选取直接影响到干扰检测准确率。根据过往经验预设k值时,无法确定所设k值下的干扰检测准... 天波雷达的干扰检测问题可转化为距离-多普勒(Range-Doppler, RD)图像分类。在RD图分类器设计中,使用K近邻(K-Nearest Neighbor, KNN)算法时,k值的选取直接影响到干扰检测准确率。根据过往经验预设k值时,无法确定所设k值下的干扰检测准确率。为此,将互近邻条件引申为k值自动赋值方法,以局部均值为距离计算依据,设计动态自适应近邻(Dynamic Adaptive Nearest Neighbor, DANN)新算法。分别在多个UCI(University of California Irvine)数据集与现有RD图库上测试,与6个常数k值下K近邻算法进行对比分析。多个UCI数据集实验表明,DANN的平均准确率比不同k值下KNN的均值高6.21%,且比最优k值高3.7%;实测RD图库实验表明,DANN的平均准确率比不同k值下KNN的均值高2.9%,且比最优k值高0.56%。因此,该算法可以在干扰检测中减少人工参与,且能够获得较高的检测准确率。 展开更多
关键词 天波雷达 干扰检测 RD图像分类 自适应近邻
下载PDF
基于改进K-最近邻算法的变电站设备分类识别方法研究
19
作者 罗金满 梁浩波 +2 位作者 王莉娜 刘卓贤 肖啸 《电测与仪表》 北大核心 2024年第10期50-56,共7页
针对变电站设备三维点云数据采集缺陷造成的场景重建精度低、效率差等问题,在对识别过程进行分析的基础上,提出了一种结合K-最近邻分类算法和改进粒子群算的变电站设备分类识别方法。使用改进的粒子群优化算法来优化K-最近邻分类器的输... 针对变电站设备三维点云数据采集缺陷造成的场景重建精度低、效率差等问题,在对识别过程进行分析的基础上,提出了一种结合K-最近邻分类算法和改进粒子群算的变电站设备分类识别方法。使用改进的粒子群优化算法来优化K-最近邻分类器的输入权重,提高了设备的分类识别精度。通过仿真进行对比分析,验证该方法的优越性。结果表明,采用该方法的分类识别效果显著,训练准确率达到100%,测试准确率达到99%,与传统识别方法相比,识别准确率从97%提高到99%,平均识别时间从85.81 s降低到0.19 s。该方法解决了变电站设备三维点云数据采集缺陷造成的场景重建精度低、效率差、识别率低等问题,有效提高了变电站设备的分类识别效果,具有良好的实用价值和可操作性。 展开更多
关键词 三维点云数据 变电站设备 分类识别 K-最近邻 粒子群算法
下载PDF
基于跨模态近邻流形散布的基因特征提取方法
20
作者 王孟明 张志鹏 侯雅魁 《湖北民族大学学报(自然科学版)》 CAS 2024年第1期59-63,共5页
为解决因基因表达数据维度高、样本少、噪声高等特点导致在基因分类研究中难以提取有效特征的问题,提出了跨模态近邻流形散布(cross-modal nearest neighbor manifold scatter,CNNMS)方法,在核方法基础上采用近邻数据的方式,从而进一步... 为解决因基因表达数据维度高、样本少、噪声高等特点导致在基因分类研究中难以提取有效特征的问题,提出了跨模态近邻流形散布(cross-modal nearest neighbor manifold scatter,CNNMS)方法,在核方法基础上采用近邻数据的方式,从而进一步降低了类别不平衡对分类精度的影响。此外,基于近邻均值受异常点影响较小的特点,CNNMS方法把高维基因特征映射到核空间,将所有样本与其近邻样本之间距离均值定义为样本的近邻均值,使跨模态近邻流形散布子空间在最大程度上保持同类特征内部的聚集性。实验结果表明,CNNMS方法在肺癌基因表达数据集上的分类识别率超过98%,在胃癌基因表达数据集上也获得了良好的分类识别率,相较于其他方法具有更好的分类能力。CNNMS方法在基因分类研究中表现出较高的识别率,对基因特征提取研究具有深远意义。 展开更多
关键词 基因特征提取 典型相关分析 数据降维 基因分类 近邻散布 鉴别敏感 癌症诊断
下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部