期刊文献+
共找到1,053篇文章
< 1 2 53 >
每页显示 20 50 100
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 被引量:4
1
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《Journal of Data Analysis and Information Processing》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 Classification algorithms NON-PARAMETRIC k-nearest-neighbor Neural Networks Random Forest Support Vector Machines
下载PDF
基于不规则区域划分方法的k-Nearest Neighbor查询算法 被引量:1
2
作者 张清清 李长云 +3 位作者 李旭 周玲芳 胡淑新 邹豪杰 《计算机系统应用》 2015年第9期186-190,共5页
随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细... 随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细介绍了一种基于不规则区域划分方法的改进型k NN查询算法,并利用对大规模数据集进行分布式并行计算的模型Map Reduce对该算法加以实现.实验结果与分析表明,Map Reduce框架下基于不规则区域划分方法的k NN查询算法可以获得较高的数据处理效率,并可以较好的支持大数据环境下数据的高效查询. 展开更多
关键词 k-nearest neighbor(k NN)查询算法 不规则区域划分方法 MAP REDUCE 大数据
下载PDF
Nearest neighbor search algorithm based on multiple background grids for fluid simulation 被引量:2
3
作者 郑德群 武频 +1 位作者 尚伟烈 曹啸鹏 《Journal of Shanghai University(English Edition)》 CAS 2011年第5期405-408,共4页
The core of smoothed particle hydrodynamics (SPH) is the nearest neighbor search subroutine. In this paper, a nearest neighbor search algorithm which is based on multiple background grids and support variable smooth... The core of smoothed particle hydrodynamics (SPH) is the nearest neighbor search subroutine. In this paper, a nearest neighbor search algorithm which is based on multiple background grids and support variable smooth length is introduced. Through tested on lid driven cavity flow, it is clear that this method can provide high accuracy. Analysis and experiments have been made on its parallelism, and the results show that this method has better parallelism and with adding processors its accuracy become higher, thus it achieves that efficiency grows in pace with accuracy. 展开更多
关键词 multiple background grids smoothed particle hydrodynamics (SPH) nearest neighbor search algorithm parallel computing
下载PDF
Nearest neighbor search algorithm for GBD tree spatial data structure
4
作者 Yutaka Ohsawa Takanobu Kurihara Ayaka Ohki 《重庆邮电大学学报(自然科学版)》 2007年第3期253-259,共7页
This paper describes the nearest neighbor (NN) search algorithm on the GBD(generalized BD) tree. The GBD tree is a spatial data structure suitable for two-or three-dimensional data and has good performance characteris... This paper describes the nearest neighbor (NN) search algorithm on the GBD(generalized BD) tree. The GBD tree is a spatial data structure suitable for two-or three-dimensional data and has good performance characteristics with respect to the dynamic data environment. On GIS and CAD systems, the R-tree and its successors have been used. In addition, the NN search algorithm is also proposed in an attempt to obtain good performance from the R-tree. On the other hand, the GBD tree is superior to the R-tree with respect to exact match retrieval, because the GBD tree has auxiliary data that uniquely determines the position of the object in the structure. The proposed NN search algorithm depends on the property of the GBD tree described above. The NN search algorithm on the GBD tree was studied and the performance thereof was evaluated through experiments. 展开更多
关键词 邻居搜索算法 GBD树 空间数据结构 动态数据环境 地理信息系统 计算机辅助设计
下载PDF
基于融合K-近邻算法的电压互感器在线监测方法
5
作者 李振华 崔九喜 +3 位作者 杨信强 吴海荣 杨诗豪 薛田良 《电网技术》 EI CSCD 北大核心 2024年第9期3938-3947,I0100,共11页
由于受工作时长和环境因素的影响,电容式电压互感器(capacitor voltage transformer,CVT)在运行过程中误差稳定性不高,易出现电能计量失准现象。为此,该文提出了一种基于融合K-近邻算法(fusion K-nearest neighbor algorithm,FKNN)的电... 由于受工作时长和环境因素的影响,电容式电压互感器(capacitor voltage transformer,CVT)在运行过程中误差稳定性不高,易出现电能计量失准现象。为此,该文提出了一种基于融合K-近邻算法(fusion K-nearest neighbor algorithm,FKNN)的电压互感器在线评估方法。该方法利用互感器的历史运行数据构建虚拟标准器,通过改进K-近邻算法对互感器实时状态进行监测,实现对异常情况的报警。同时,提出了一种加权移动时间窗的方法,自适应更新异常阈值,有效削弱电网不平衡波动的影响。实验结果表明,该文方法能够准确监测互感器的0.2级误差漂移。 展开更多
关键词 电压互感器 虚拟标准器 k-近邻算法 自适应更新
下载PDF
基于K-近邻算法改进粒子群-反向传播算法的织物质量预测技术
6
作者 孙长敏 戴宁 +5 位作者 沈春娅 徐开心 陈炜 胡旭东 袁嫣红 陈祖红 《纺织学报》 EI CAS CSCD 北大核心 2024年第7期72-77,共6页
为解决现有下机织物质量差异性较大且传统验布环节时间较长等问题,提出基于K-近邻(KNN)算法改进粒子群-反向传播(PSO-BP)算法的织物质量等级预测方法。首先分析织物质量预测模型,整理织物疵点类型与织物质量等级分类,并根据织物疵点特... 为解决现有下机织物质量差异性较大且传统验布环节时间较长等问题,提出基于K-近邻(KNN)算法改进粒子群-反向传播(PSO-BP)算法的织物质量等级预测方法。首先分析织物质量预测模型,整理织物疵点类型与织物质量等级分类,并根据织物疵点特征将疵点划分为6类;其次选取14种影响织物质量的因子作为模型输入量;然后详细介绍依据KNN与PSO原理进行织物质量预测流程;最后以浙江兰溪某纺织厂近3个月16186条织物生产数据为例,建立织物质量预测模型。结果显示:该技术对织物质量预测的准确率达到98.054%,且训练时长仅需4.8 s,在保证织物质量预测准确性的同时,极大缩短了检测时间,提高了织造车间生产效率。 展开更多
关键词 织布车间 织物质量 k-近邻算法 粒子群-反向传播神经网络算法 织物质量预测
下载PDF
支持K-近邻搜索的区块链泛用型数据隐私保护方法
7
作者 王胜 潘正高 董全德 《辽宁大学学报(自然科学版)》 CAS 2024年第2期147-157,共11页
随着区块链泛用型数据应用场景的不断扩大,其涉及的数据隐私越来越多,数据隐私泄露可能导致个人信用受损,带来财产损失甚至身份盗用等.合理高效地进行用户身份信息及数据隐私保护是确保区块链泛用型数据安全的关键问题.为此,本文提出了... 随着区块链泛用型数据应用场景的不断扩大,其涉及的数据隐私越来越多,数据隐私泄露可能导致个人信用受损,带来财产损失甚至身份盗用等.合理高效地进行用户身份信息及数据隐私保护是确保区块链泛用型数据安全的关键问题.为此,本文提出了支持K-近邻搜索的区块链泛用型数据隐私保护方法,采集区块链泛用型数据,利用k-prototypes算法,聚类区块链泛用型数据,并控制分类属性和数值属性.在此基础上,本文支持K-近邻搜索,建立区块链泛用型数据系统模型,确定区块链泛用型数据敏感区域,实现区块链泛用型数据隐私保护.实验结果表明,本文所提方法具有较好的区块链泛用型数据隐私保护效果,能够有效提高区块链泛用型数据隐私保护安全性,缩短区块链泛用型数据隐私保护时间. 展开更多
关键词 k-近邻搜索 区块链 泛用型数据 k-prototypes算法 数据隐私保护
下载PDF
Comparison of Two Quantum Nearest Neighbor Classifiers on IBM’s Quantum Simulator
8
作者 Wei Hu 《Natural Science》 2018年第3期87-98,共12页
Today computers are used to store data in memory and then process them. In our big data era, we are facing the challenge of storing and processing the data simply due to their fast ever growing size. Quantum computati... Today computers are used to store data in memory and then process them. In our big data era, we are facing the challenge of storing and processing the data simply due to their fast ever growing size. Quantum computation offers solutions to these two prominent issues quantum mechanically and beautifully. Through careful design to employ superposition, entanglement, and interference of quantum states, a quantum algorithm can allow a quantum computer to store datasets of exponentially large size as linear size and then process them in parallel. Quantum computing has found its way in the world of machine learning where new ideas and approaches are in great need as the classical computers have reached their capacity and the demand for processing big data grows much faster than the computing power the classical computers can provide today. Nearest neighbor algorithms are simple, robust, and versatile supervised machine learning algorithms, which store all training data points as their learned “model” and make the prediction of a new test data point by computing the distances between the query point and all the training data points. Quantum counterparts of these classical algorithms provide efficient and elegant ways to deal with the two major issues of storing data in memory and computing the distances. The purpose of our study is to select two similar quantum nearest neighbor algorithms and use a simple dataset to give insight into how they work, highlight their quantum nature, and compare their performances on IBM’s quantum simulator. 展开更多
关键词 QUANTUM COMPUTATION QUANTUM MACHINE Learning QUANTUM nearest neighbor algorithm
下载PDF
基于K-近邻与FOA改进聚类的数据异常分析模型及用电行为分析
9
作者 周伟 牛誉蓉 《成都工业学院学报》 2024年第5期11-16,共6页
对隐藏在大数据中的信息进行深层挖掘时,由于存在数据来源、统计口径、人员输入、行为异常等方面的问题,可能出现异常数据。针对此类问题,首先利用离散小波变换进行多尺度分解,然后采用K-近邻思想对局部区域的密度、距离重新定义,来提... 对隐藏在大数据中的信息进行深层挖掘时,由于存在数据来源、统计口径、人员输入、行为异常等方面的问题,可能出现异常数据。针对此类问题,首先利用离散小波变换进行多尺度分解,然后采用K-近邻思想对局部区域的密度、距离重新定义,来提高对异常值的识别精度;最后结合改进的果蝇优化算法,对密度峰值聚类算法中的截断距离进行优化,提出基于K-近邻与改进果蝇优化的密度峰值聚类异常分析模型。从异常值检测角度进行仿真实验分析,根据用户数据多时间尺度特征,对不同时间尺度的复合数据进行聚类,对用电行为进行分析;选择多种标准测试函数,对基于知识学习的改进果蝇优化算法性能进行对比研究。结果显示,基于K-近邻的算法能够将变压器中不同于正常运行模式的少数异常曲线及单个用户的异常用电模式检测出来,其有效性得到了验证。在基于知识学习的改进果蝇优化算法中,随着果蝇个体数量增加其寻优能力也得到提高。 展开更多
关键词 异常值检测 果蝇优化算法 k-近邻算法 峰值聚类算法 用电行为
下载PDF
基于改进K-最近邻算法的变电站设备分类识别方法研究
10
作者 罗金满 梁浩波 +2 位作者 王莉娜 刘卓贤 肖啸 《电测与仪表》 北大核心 2024年第10期50-56,共7页
针对变电站设备三维点云数据采集缺陷造成的场景重建精度低、效率差等问题,在对识别过程进行分析的基础上,提出了一种结合K-最近邻分类算法和改进粒子群算的变电站设备分类识别方法。使用改进的粒子群优化算法来优化K-最近邻分类器的输... 针对变电站设备三维点云数据采集缺陷造成的场景重建精度低、效率差等问题,在对识别过程进行分析的基础上,提出了一种结合K-最近邻分类算法和改进粒子群算的变电站设备分类识别方法。使用改进的粒子群优化算法来优化K-最近邻分类器的输入权重,提高了设备的分类识别精度。通过仿真进行对比分析,验证该方法的优越性。结果表明,采用该方法的分类识别效果显著,训练准确率达到100%,测试准确率达到99%,与传统识别方法相比,识别准确率从97%提高到99%,平均识别时间从85.81 s降低到0.19 s。该方法解决了变电站设备三维点云数据采集缺陷造成的场景重建精度低、效率差、识别率低等问题,有效提高了变电站设备的分类识别效果,具有良好的实用价值和可操作性。 展开更多
关键词 三维点云数据 变电站设备 分类识别 k-最近邻 粒子群算法
下载PDF
A Study of EM Algorithm as an Imputation Method: A Model-Based Simulation Study with Application to a Synthetic Compositional Data
11
作者 Yisa Adeniyi Abolade Yichuan Zhao 《Open Journal of Modelling and Simulation》 2024年第2期33-42,共10页
Compositional data, such as relative information, is a crucial aspect of machine learning and other related fields. It is typically recorded as closed data or sums to a constant, like 100%. The statistical linear mode... Compositional data, such as relative information, is a crucial aspect of machine learning and other related fields. It is typically recorded as closed data or sums to a constant, like 100%. The statistical linear model is the most used technique for identifying hidden relationships between underlying random variables of interest. However, data quality is a significant challenge in machine learning, especially when missing data is present. The linear regression model is a commonly used statistical modeling technique used in various applications to find relationships between variables of interest. When estimating linear regression parameters which are useful for things like future prediction and partial effects analysis of independent variables, maximum likelihood estimation (MLE) is the method of choice. However, many datasets contain missing observations, which can lead to costly and time-consuming data recovery. To address this issue, the expectation-maximization (EM) algorithm has been suggested as a solution for situations including missing data. The EM algorithm repeatedly finds the best estimates of parameters in statistical models that depend on variables or data that have not been observed. This is called maximum likelihood or maximum a posteriori (MAP). Using the present estimate as input, the expectation (E) step constructs a log-likelihood function. Finding the parameters that maximize the anticipated log-likelihood, as determined in the E step, is the job of the maximization (M) phase. This study looked at how well the EM algorithm worked on a made-up compositional dataset with missing observations. It used both the robust least square version and ordinary least square regression techniques. The efficacy of the EM algorithm was compared with two alternative imputation techniques, k-Nearest Neighbor (k-NN) and mean imputation (), in terms of Aitchison distances and covariance. 展开更多
关键词 Compositional Data Linear Regression Model Least Square Method Robust Least Square Method Synthetic Data Aitchison Distance Maximum Likelihood Estimation Expectation-Maximization algorithm k-nearest neighbor and Mean imputation
下载PDF
基于K-means和近邻回归算法的Kinect植株深度图像修复 被引量:19
12
作者 沈跃 徐慧 +1 位作者 刘慧 李宁 《农业工程学报》 EI CAS CSCD 北大核心 2016年第19期188-194,共7页
针对Kinect传感器应用于农业植株检测产生的图像噪声问题,特别是由光线以及传感器自身局限导致的匹配图像目标植株数据的缺失,提出一种基于K-means和近邻回归算法的植株深度检测图像修复方法。首先对Kinect传感器获取的彩色RGB图像进行... 针对Kinect传感器应用于农业植株检测产生的图像噪声问题,特别是由光线以及传感器自身局限导致的匹配图像目标植株数据的缺失,提出一种基于K-means和近邻回归算法的植株深度检测图像修复方法。首先对Kinect传感器获取的彩色RGB图像进行阈值分割预处理提取植株目标区域,再利用K-means聚类算法去除背景噪声,使得植株目标区域轮廓更加清晰;然后基于配准的彩色图像和深度图像,对获取的深度图像中可疑像素点的深度数据采取近邻回归算法进行修复,再将修复后的深度图像与目标分割后的彩色图像进行植株区域的匹配,并进行二次近邻回归算法修正错误的深度数据,最后获取目标植株深度信息的检测图像。试验结果证明,采用RGB阈值分割和K-means聚类算法植株目标区域分割误差均值为12.33%,比单一RGB阈值分割和K-means聚类分割误差降低了12.12和41.48个百分点;同时结合聚类后的彩色图像对深度数据进行两次近邻回归算法修复深度数据,能够提高深度数据边缘的清晰度,单帧深度数据空洞点进行修复数据的准确度提高。该研究结果可为农业植株检测、植株三维重构、精准对靶喷雾等提供参考。 展开更多
关键词 图像处理 图像分割 算法 植株检测 深度数据 图像修复 k-MEANS聚类 近邻回归
下载PDF
基于K-最近邻算法的未知病毒检测 被引量:15
13
作者 张波云 殷建平 +1 位作者 张鼎兴 嵩敬波 《计算机工程与应用》 CSCD 北大核心 2005年第6期7-10,共4页
因为准确检测计算机病毒是不可判定的,故该文提出了一种基于实例学习的k-最近邻算法来实现对计算机病毒的近似检测。该法可以克服病毒特征代码扫描法不能识别未知病毒的缺点。在该检测方法的基础上,文章设计了一个病毒检测网络模型,此... 因为准确检测计算机病毒是不可判定的,故该文提出了一种基于实例学习的k-最近邻算法来实现对计算机病毒的近似检测。该法可以克服病毒特征代码扫描法不能识别未知病毒的缺点。在该检测方法的基础上,文章设计了一个病毒检测网络模型,此模型适用于实时在线系统中的病毒检测,既可以实现对已知病毒的查杀,又可以对可疑程序行为进行分析评判,最终实现对未知病毒的识别。 展开更多
关键词 计算机病毒 k-最近邻算法 病毒检测
下载PDF
基于对角化LDPC压缩感知和k-近邻算法的广域系统宽频振荡监测方法 被引量:15
14
作者 冯双 崔昊 +4 位作者 吴熙 冯俊杰 邹常跃 赵晓斌 汤奕 《电网技术》 EI CSCD 北大核心 2021年第8期3025-3033,共9页
在“双高”电力系统中,宽频振荡的发生概率大大增加。然而,传统基于广域测量系统(wide area measurement system,WAMS)的振荡监测方法一方面监测的振荡频带范围过窄,另一方面其准确性和快速性难以适应复杂的电网运行状态。因此提出一种... 在“双高”电力系统中,宽频振荡的发生概率大大增加。然而,传统基于广域测量系统(wide area measurement system,WAMS)的振荡监测方法一方面监测的振荡频带范围过窄,另一方面其准确性和快速性难以适应复杂的电网运行状态。因此提出一种基于对角化低密度奇偶校验码(low-density parity-check codes,LDPC)校验矩阵和k-近邻算法(k-nearest neighbor,KNN)的宽频振荡监测方法。首先,基于对角化LDPC校验矩阵对电力系统信号进行压缩采样,大大减少了宽频振荡的数据传输量,有利于在现有相量测量单元(phasor measurement unit,PMU)上传频率下实现几百Hz的宽频振荡数据的传输。在此基础上,主站直接基于压缩采样值作为输入特征,采用加权KNN算法进行振荡检测,避免了人为设置阈值带来的误判,提高了振荡检测的快速性和准确性。最后,根据振荡检测结果,采用正交匹配追踪(orthogonal matching pursuit,OMP)算法,在主站准确重构宽频振荡信号,便于广域系统的振荡全局性分析。仿真结果表明所提方法在噪声、数据缺失和数据有误等情况下,仍然能够实现宽频振荡信号的快速准确监测。 展开更多
关键词 宽频振荡监测 压缩感知技术 对角化LDPC k-近邻算法
下载PDF
基于K-近邻算法的文本情感分析方法研究 被引量:10
15
作者 樊娜 安毅生 李慧贤 《计算机工程与设计》 CSCD 北大核心 2012年第3期1160-1164,共5页
为了识别网络文本的情感倾向性,通过分析文本结构以及情感表达的特点,提出了一种基于K-近邻的文本情感分析方法,将整个文本的情感划分为局部情感和全局情感。建立条件随机场模型,确定文本中的局部情感,通过K-近邻算法计算文本的全局情... 为了识别网络文本的情感倾向性,通过分析文本结构以及情感表达的特点,提出了一种基于K-近邻的文本情感分析方法,将整个文本的情感划分为局部情感和全局情感。建立条件随机场模型,确定文本中的局部情感,通过K-近邻算法计算文本的全局情感。实验结果表明,与传统机器学习方法相比,该方法能细粒度、多层次的分析文本的情感,同时能有效提高情感分析的准确率。 展开更多
关键词 情感分析 局部情感 全局情感 层次化模型 条件随机场模型 k-近邻算法
下载PDF
基于振动采用k-近邻法的机器人地形分类 被引量:6
16
作者 薛开 李强 +1 位作者 徐贺 王天龙 《振动.测试与诊断》 EI CSCD 北大核心 2013年第1期88-92,167-168,共5页
由于地形分类对于提高移动机器人的自治移动性能十分重要,尤其在行星表面探测时尤为突出。在四轮移动机器人左前轮轮臂上安装x,y,z向加速度计和z向传声器,使之在沙、碎石、草、土、沥青地面上分别以6种速度行驶,通过提取车轮与地面相互... 由于地形分类对于提高移动机器人的自治移动性能十分重要,尤其在行星表面探测时尤为突出。在四轮移动机器人左前轮轮臂上安装x,y,z向加速度计和z向传声器,使之在沙、碎石、草、土、沥青地面上分别以6种速度行驶,通过提取车轮与地面相互作用的振动信号来进行地形分类。该方法避免了视觉分类方法受光照变化影响大、易被地形表面的遮盖物蒙蔽的缺陷。对原始信号进行时域幅值分析,采用k-近邻法及投票决策法实现分类,并提出了票数相同情形下的新算法。实验验证了该算法的有效性。 展开更多
关键词 移动机器人 地形分类 振动 k-近邻法
下载PDF
量子K-近邻算法 被引量:7
17
作者 陈汉武 高越 张军 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第4期647-651,共5页
为了提高经典K-近邻算法的效率,引入量子计算理论,将Grover算法中的Oracle算子以及相位估计算法嵌入经典K-近邻算法,提出一种量子K-近邻算法.该算法首先将样本点和待分类点的向量信息制备成量子叠加态,采用可逆的量子控制交换门并行计... 为了提高经典K-近邻算法的效率,引入量子计算理论,将Grover算法中的Oracle算子以及相位估计算法嵌入经典K-近邻算法,提出一种量子K-近邻算法.该算法首先将样本点和待分类点的向量信息制备成量子叠加态,采用可逆的量子控制交换门并行计算待分类点和样本点的相似度,然后利用相位估计算法将相似度信息存储到量子比特中,最后使用Grover算法一次性搜索出最相似的k个点.对嵌入的量子计算部分的理论分析结果表明,量子K-近邻算法可以明显降低经典计算复杂度,且提出的算法在已有算法计算复杂度O(RkM)的基础上,再次带来了k值的二次加速O(RkM),其中R为Oracle算子的执行次数,M为样本全局个数. 展开更多
关键词 机器学习 k-近邻算法 量子算法
下载PDF
一种自适应k-最近邻算法的研究 被引量:16
18
作者 余小鹏 周德翼 《计算机应用研究》 CSCD 北大核心 2006年第2期70-72,共3页
针对传统k-最近邻算法(k-NearestNeighbor,kNN)存在搜索慢的缺陷,提出了一种改进型的自适应k-最近邻算法。该方法在以测试样本点为中心的超球内进行搜索,对超球半径的生长进行采样,建立半径生长的BP神经网络模型,逼近半径变化函数,并用... 针对传统k-最近邻算法(k-NearestNeighbor,kNN)存在搜索慢的缺陷,提出了一种改进型的自适应k-最近邻算法。该方法在以测试样本点为中心的超球内进行搜索,对超球半径的生长进行采样,建立半径生长的BP神经网络模型,逼近半径变化函数,并用该函数指导超球体的生长。该方法有效地缩小了搜索范围,减少了超球体半径生长的试探次数,对处理稀疏数据集有明显的优越性。 展开更多
关键词 模式分类 k-最近邻算法 超球 BP网络算法
下载PDF
基于k-最近邻图的小样本KNN分类算法 被引量:27
19
作者 刘应东 牛惠民 《计算机工程》 CAS CSCD 北大核心 2011年第9期198-200,共3页
提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对... 提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对象进行类别标识。采用标准数据集进行测试,结果表明该算法在小样本情况下能够提高KNN的分类精度,减小最近邻阈值k对分类效果的影响。 展开更多
关键词 KNN算法 k-最近邻图 小样本 图划分 分类算法
下载PDF
基于哈希技术和MapReduce的大数据集K-近邻算法 被引量:7
20
作者 翟俊海 张明阳 +1 位作者 王婷婷 郝璞 《计算机科学》 CSCD 北大核心 2017年第7期210-214,共5页
K-近邻是一种著名的分类算法。由于简单且易于实现,因此其被广泛应用于许多领域,如人脸识别、基因分类、决策支持等。然而,在大数据环境中,K-近邻算法变得非常低效,甚至不可行。针对这一问题,提出了一种基于哈希技术和MapReduce的大数据... K-近邻是一种著名的分类算法。由于简单且易于实现,因此其被广泛应用于许多领域,如人脸识别、基因分类、决策支持等。然而,在大数据环境中,K-近邻算法变得非常低效,甚至不可行。针对这一问题,提出了一种基于哈希技术和MapReduce的大数据集K-近邻分类算法。为了验证算法的有效性,在4个大数据集上进行了实验,结果显示,在保持分类能力的前提下,所提算法可以大幅度地提高K-近邻算法的效率。 展开更多
关键词 k-近邻 哈希技术 分类算法 大数据集
下载PDF
上一页 1 2 53 下一页 到第
使用帮助 返回顶部