期刊文献+
共找到2,240篇文章
< 1 2 112 >
每页显示 20 50 100
基于融合K-近邻算法的电压互感器在线监测方法
1
作者 李振华 崔九喜 +3 位作者 杨信强 吴海荣 杨诗豪 薛田良 《电网技术》 EI CSCD 北大核心 2024年第9期3938-3947,I0100,共11页
由于受工作时长和环境因素的影响,电容式电压互感器(capacitor voltage transformer,CVT)在运行过程中误差稳定性不高,易出现电能计量失准现象。为此,该文提出了一种基于融合K-近邻算法(fusion K-nearest neighbor algorithm,FKNN)的电... 由于受工作时长和环境因素的影响,电容式电压互感器(capacitor voltage transformer,CVT)在运行过程中误差稳定性不高,易出现电能计量失准现象。为此,该文提出了一种基于融合K-近邻算法(fusion K-nearest neighbor algorithm,FKNN)的电压互感器在线评估方法。该方法利用互感器的历史运行数据构建虚拟标准器,通过改进K-近邻算法对互感器实时状态进行监测,实现对异常情况的报警。同时,提出了一种加权移动时间窗的方法,自适应更新异常阈值,有效削弱电网不平衡波动的影响。实验结果表明,该文方法能够准确监测互感器的0.2级误差漂移。 展开更多
关键词 电压互感器 虚拟标准器 k-近邻算法 自适应更新
下载PDF
基于数字孪生与k-近邻算法的车间设备运行状态预测研究
2
作者 和征 李忠鹏 杨小红 《制造技术与机床》 北大核心 2024年第3期193-199,共7页
由于传统车间设备运行状态预测不能有效利用历史数据进行学习,实时响应能力有限,难以在复杂调度环境中取得良好效果,因此文章提出一种数字孪生与k-近邻算法相结合的车间设备运行状态预测模型。构建车间设备实体在信息空间的数字孪生模型... 由于传统车间设备运行状态预测不能有效利用历史数据进行学习,实时响应能力有限,难以在复杂调度环境中取得良好效果,因此文章提出一种数字孪生与k-近邻算法相结合的车间设备运行状态预测模型。构建车间设备实体在信息空间的数字孪生模型,并建立设备实体与模型之间的映射关系,从而获取实时特征数据,即设备的运行状态特征数据。运用k-近邻算法计算实时特征数据与历史数据之间的欧几里得距离,即计算设备当前运行状态与历史已知状态的相似度,最终通过前k个距离所对应的设备历史运行状态数据,预测设备的当前运行状态。该模型的本质是通过数字孪生的实时数据采集,获取指定设备运行状态特征数据,运用k-近邻算法预测设备的实时运行状态。相较以往研究,本研究贡献在于提高设备实时运行状态预测的准确率。如果将数字孪生、k-近邻算法与具备自我学习能力的相关算法相结合,模型的预测效果会更好。 展开更多
关键词 k-近邻算法 机器学习 数字孪生 车间设备运行状态预测
下载PDF
坝肩岩体质量LDA-KNN分类模型 被引量:1
3
作者 荀鹏 李娟 +2 位作者 魏玉峰 李常虎 范文东 《成都理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期281-290,302,共11页
工程岩体质量分级评价对工程的安全、设计、经济效益等有重要影响。针对当前岩级划分方法中存在不确定性,人为因素干扰和忽视了传统定性分级中对岩体质量评价的重要性等问题,本文通过在工程实际中搜集样本建立数据库,从工程的实际需求出... 工程岩体质量分级评价对工程的安全、设计、经济效益等有重要影响。针对当前岩级划分方法中存在不确定性,人为因素干扰和忽视了传统定性分级中对岩体质量评价的重要性等问题,本文通过在工程实际中搜集样本建立数据库,从工程的实际需求出发,选择岩体完整性系数(K v)、结构面间距(D)、岩石质量指标(RQD)等合适的评价指标,通过引入LDA(Linear Discriminant Analysis)降维方法和K近邻分析(K-Nearest-Neighbor,KNN)相结合的多分类模型,实现了岩体的非线性分级预测。通过定性定量相结合实现了岩体多因素,多指标的综合分级,并解决了多指标判断时信息冗余,复杂程度高的问题。与其他判别方案相比较,模型得出的结果准确率高,符合工程实际,减少了人为因素的影响,体现出较强的预测判别能力。该研究为水电站大坝坝肩处的平硐岩体质量划分提出了一种可行的预测方案。 展开更多
关键词 岩体结构 岩体质量分级 线性降维 k近邻算法 分类模型
下载PDF
基于MDk-DPC的空中目标自动分群方法
4
作者 马钰棠 孙鹏 +2 位作者 张杰勇 闫云飞 赵亮 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第10期3219-3229,共11页
空中目标分群本质上是一个类数未知的聚类问题,也是战场态势估计领域中的研究热点。针对未知的空战场环境,从聚类角度提出一种基于流形距离和k近邻采样密度的MDk-DPC算法。引入流形距离代替欧氏距离,以增加同一流形中目标的相似性;利用... 空中目标分群本质上是一个类数未知的聚类问题,也是战场态势估计领域中的研究热点。针对未知的空战场环境,从聚类角度提出一种基于流形距离和k近邻采样密度的MDk-DPC算法。引入流形距离代替欧氏距离,以增加同一流形中目标的相似性;利用k近邻计算目标的局部密度,使其能更真实地反映目标周围分布;通过自适应选取聚类中心方法确定聚类中心,并运用密度峰值算法指定剩余点类别完成分群。仿真实验表明,所提方法在人工合成数据集和UCI真实数据集上均有更好的聚类性能,同时通过对空战场仿真数据进行分群验证了所提方法的可行性和有效性。 展开更多
关键词 态势估计 目标分群 流形距离 k近邻 密度峰值聚类
下载PDF
基于K-近邻算法改进粒子群-反向传播算法的织物质量预测技术
5
作者 孙长敏 戴宁 +5 位作者 沈春娅 徐开心 陈炜 胡旭东 袁嫣红 陈祖红 《纺织学报》 EI CAS CSCD 北大核心 2024年第7期72-77,共6页
为解决现有下机织物质量差异性较大且传统验布环节时间较长等问题,提出基于K-近邻(KNN)算法改进粒子群-反向传播(PSO-BP)算法的织物质量等级预测方法。首先分析织物质量预测模型,整理织物疵点类型与织物质量等级分类,并根据织物疵点特... 为解决现有下机织物质量差异性较大且传统验布环节时间较长等问题,提出基于K-近邻(KNN)算法改进粒子群-反向传播(PSO-BP)算法的织物质量等级预测方法。首先分析织物质量预测模型,整理织物疵点类型与织物质量等级分类,并根据织物疵点特征将疵点划分为6类;其次选取14种影响织物质量的因子作为模型输入量;然后详细介绍依据KNN与PSO原理进行织物质量预测流程;最后以浙江兰溪某纺织厂近3个月16186条织物生产数据为例,建立织物质量预测模型。结果显示:该技术对织物质量预测的准确率达到98.054%,且训练时长仅需4.8 s,在保证织物质量预测准确性的同时,极大缩短了检测时间,提高了织造车间生产效率。 展开更多
关键词 织布车间 织物质量 k-近邻算法 粒子群-反向传播神经网络算法 织物质量预测
下载PDF
支持K-近邻搜索的区块链泛用型数据隐私保护方法
6
作者 王胜 潘正高 董全德 《辽宁大学学报(自然科学版)》 CAS 2024年第2期147-157,共11页
随着区块链泛用型数据应用场景的不断扩大,其涉及的数据隐私越来越多,数据隐私泄露可能导致个人信用受损,带来财产损失甚至身份盗用等.合理高效地进行用户身份信息及数据隐私保护是确保区块链泛用型数据安全的关键问题.为此,本文提出了... 随着区块链泛用型数据应用场景的不断扩大,其涉及的数据隐私越来越多,数据隐私泄露可能导致个人信用受损,带来财产损失甚至身份盗用等.合理高效地进行用户身份信息及数据隐私保护是确保区块链泛用型数据安全的关键问题.为此,本文提出了支持K-近邻搜索的区块链泛用型数据隐私保护方法,采集区块链泛用型数据,利用k-prototypes算法,聚类区块链泛用型数据,并控制分类属性和数值属性.在此基础上,本文支持K-近邻搜索,建立区块链泛用型数据系统模型,确定区块链泛用型数据敏感区域,实现区块链泛用型数据隐私保护.实验结果表明,本文所提方法具有较好的区块链泛用型数据隐私保护效果,能够有效提高区块链泛用型数据隐私保护安全性,缩短区块链泛用型数据隐私保护时间. 展开更多
关键词 k-近邻搜索 区块链 泛用型数据 k-prototypes算法 数据隐私保护
下载PDF
基于K-Nearest Neighbor和神经网络的糖尿病分类研究 被引量:6
7
作者 陈真诚 杜莹 +3 位作者 邹春林 梁永波 吴植强 朱健铭 《中国医学物理学杂志》 CSCD 2018年第10期1220-1224,共5页
为实现糖尿病的早期筛查,提高对糖尿病分类的准确度,在研究有关糖尿病危险因素的基础上,增加糖化血红蛋白作为糖尿病早期筛查的特征之一。研究中选取与人类最为相似的食蟹猴作为研究对象,利用年龄、血压、腹围、BMI、糖化血红蛋白以及... 为实现糖尿病的早期筛查,提高对糖尿病分类的准确度,在研究有关糖尿病危险因素的基础上,增加糖化血红蛋白作为糖尿病早期筛查的特征之一。研究中选取与人类最为相似的食蟹猴作为研究对象,利用年龄、血压、腹围、BMI、糖化血红蛋白以及空腹血糖作为特征输入,将正常、糖尿病前期和糖尿病作为类别输出,利用K-Nearest Neighbor(KNN)和神经网络两种方法对其分类。发现在增加糖化血红蛋白作为分类特征之一时,KNN(K=3)和神经网络的分类准确率分别为81.8%和92.6%,明显高于没有这一特征时的准确率(68.1%和89.7%),KNN和神经网络都可以对食蟹猴数据进行分类和识别,起到早期筛查作用。 展开更多
关键词 糖尿病 糖化血红蛋白 空腹血糖 kNN 神经网络 食蟹猴
下载PDF
基于邻域互信息与K-means特征聚类的特征选择 被引量:1
8
作者 孙林 梁娜 徐久成 《智能系统学报》 CSCD 北大核心 2024年第4期983-996,共14页
针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为... 针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为自适应邻域半径,确定样本的邻域集,并由此构建自适应邻域熵、邻域互信息、归一化邻域互信息等度量,反映特征之间的相关性;然后,基于归一化邻域互信息构建自适应K近邻集合,利用Pearson相关系数表示特征的权重定义加权K近邻密度,实现自动选取K-means算法的簇中心,进而完成K-means特征聚类;最后,给出加权平均冗余度,选出每个特征簇中加权平均冗余度最大的特征构成最优特征子集。实验结果表明所提算法不仅可以有效提升特征选择的分类结果而且可以获得更好的聚类效果。 展开更多
关键词 特征选择 邻域互信息 k-MEANS 特征聚类 自适应k近邻 特征权重 加权k近邻密度
下载PDF
基于K-近邻与FOA改进聚类的数据异常分析模型及用电行为分析
9
作者 周伟 牛誉蓉 《成都工业学院学报》 2024年第5期11-16,共6页
对隐藏在大数据中的信息进行深层挖掘时,由于存在数据来源、统计口径、人员输入、行为异常等方面的问题,可能出现异常数据。针对此类问题,首先利用离散小波变换进行多尺度分解,然后采用K-近邻思想对局部区域的密度、距离重新定义,来提... 对隐藏在大数据中的信息进行深层挖掘时,由于存在数据来源、统计口径、人员输入、行为异常等方面的问题,可能出现异常数据。针对此类问题,首先利用离散小波变换进行多尺度分解,然后采用K-近邻思想对局部区域的密度、距离重新定义,来提高对异常值的识别精度;最后结合改进的果蝇优化算法,对密度峰值聚类算法中的截断距离进行优化,提出基于K-近邻与改进果蝇优化的密度峰值聚类异常分析模型。从异常值检测角度进行仿真实验分析,根据用户数据多时间尺度特征,对不同时间尺度的复合数据进行聚类,对用电行为进行分析;选择多种标准测试函数,对基于知识学习的改进果蝇优化算法性能进行对比研究。结果显示,基于K-近邻的算法能够将变压器中不同于正常运行模式的少数异常曲线及单个用户的异常用电模式检测出来,其有效性得到了验证。在基于知识学习的改进果蝇优化算法中,随着果蝇个体数量增加其寻优能力也得到提高。 展开更多
关键词 异常值检测 果蝇优化算法 k-近邻算法 峰值聚类算法 用电行为
下载PDF
基于CK-Hough联合算法的人体微多普勒频率估计
10
作者 陈雨馨 彭意群 +1 位作者 柳润金 丁一鹏 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第9期3329-3341,共13页
为了准确地从雷达回波信号中提取运动目标特定部位的微多普勒频率,本文提出一种新颖的CKHough算法,该算法有效地结合了聚类分析和K近邻-霍夫(KNN-Hough)算法。首先,通过短时傅里叶变换获取雷达回波信号的时频谱图;其次,利用自适应模糊C... 为了准确地从雷达回波信号中提取运动目标特定部位的微多普勒频率,本文提出一种新颖的CKHough算法,该算法有效地结合了聚类分析和K近邻-霍夫(KNN-Hough)算法。首先,通过短时傅里叶变换获取雷达回波信号的时频谱图;其次,利用自适应模糊C均值算法对时频图进行聚类分析,在这一过程中,本文采用数据预处理技术自适应调整聚类类别数c以适应多样化应用场景,从而获得人体各散射部位的频域范围,有效地抑制了分量间的相互干扰;第三,通过改进度量函数的K近邻算法增强相邻时刻聚类结果的相关性,拟合各部位的瞬时频率曲线;最后,采用霍夫变换动态调整度量函数中权值μ的取值,得到目标微多普勒频率的精确估计结果。研究结果表明:本文提出的CK-Hough提取了直/曲线行走场景下人类目标四肢的微多普勒频率;与传统的峰值搜索算法、线性预测维特比算法以及基于Bezier-Hough模型的频率拟合算法相比,本文提出的CK-Hough算法在直线行走实验场景下,总频率的估计误差率分别降低了40.40%、45.47%和26.16%;在曲线行走实验场景下,其估计误差率分别降低了58.35%、68.35%和41.65%。 展开更多
关键词 微多普勒频率提取 时频分析 自适应模糊C均值聚类 k近邻 霍夫变换
下载PDF
基于PCA-BOA-KNN模型的水下爆炸舰船结构破损评估
11
作者 梁潇帝 刘寅东 《中国舰船研究》 CSCD 北大核心 2024年第3期150-157,共8页
[目的]为解决水下爆炸作用下舰船结构破口损伤评估问题,建立一种基于PCA-BOA-KNN模型的破口预报方法。[方法]首先,分别建立五舱段和七舱段有限元模型,对21组水下爆炸工况进行爆炸仿真分析;然后,基于主成分分析(PCA)法,对加速度峰值、速... [目的]为解决水下爆炸作用下舰船结构破口损伤评估问题,建立一种基于PCA-BOA-KNN模型的破口预报方法。[方法]首先,分别建立五舱段和七舱段有限元模型,对21组水下爆炸工况进行爆炸仿真分析;然后,基于主成分分析(PCA)法,对加速度峰值、速度峰值、位移峰值、应力峰值和超压峰值进行降维处理,得到2个本征特征量;最后,将由主成分分析法得到的结果代入贝叶斯网络优化(BOA)的KNN模型,通过建立的破口预报模型,预测一组工况下舰船不同剖面处的破口情况。[结果]结果显示,通过主成分分析法提取的前2个因子的累计贡献率为85.165%,这2个因子可代表5个特征量的主要信息;基于PCA-BOAKNN模型的破口预报结果与仿真结果基本一致。[结论]所提的预报模型方法对舰船结构破口预报有效,对于不同主尺度船体结构破口预报有一定的参考价值。 展开更多
关键词 结构分析 主成分分析 kNN算法 水下爆炸
下载PDF
基于改进K-最近邻算法的变电站设备分类识别方法研究
12
作者 罗金满 梁浩波 +2 位作者 王莉娜 刘卓贤 肖啸 《电测与仪表》 北大核心 2024年第10期50-56,共7页
针对变电站设备三维点云数据采集缺陷造成的场景重建精度低、效率差等问题,在对识别过程进行分析的基础上,提出了一种结合K-最近邻分类算法和改进粒子群算的变电站设备分类识别方法。使用改进的粒子群优化算法来优化K-最近邻分类器的输... 针对变电站设备三维点云数据采集缺陷造成的场景重建精度低、效率差等问题,在对识别过程进行分析的基础上,提出了一种结合K-最近邻分类算法和改进粒子群算的变电站设备分类识别方法。使用改进的粒子群优化算法来优化K-最近邻分类器的输入权重,提高了设备的分类识别精度。通过仿真进行对比分析,验证该方法的优越性。结果表明,采用该方法的分类识别效果显著,训练准确率达到100%,测试准确率达到99%,与传统识别方法相比,识别准确率从97%提高到99%,平均识别时间从85.81 s降低到0.19 s。该方法解决了变电站设备三维点云数据采集缺陷造成的场景重建精度低、效率差、识别率低等问题,有效提高了变电站设备的分类识别效果,具有良好的实用价值和可操作性。 展开更多
关键词 三维点云数据 变电站设备 分类识别 k-最近邻 粒子群算法
下载PDF
基于KNN-TCN模型的蒸发皿蒸发量预测研究
13
作者 谢育珽 郑翔天 +6 位作者 史俊才 刘萍 申文明 程文飞 李新华 杨静 邢云飞 《人民黄河》 CAS 北大核心 2024年第6期113-118,125,共7页
蒸发量的精确预测对合理开发利用水资源、旱涝变化趋势研究和农作物灌溉用水量的估算具有十分重要的意义。选取我国北方地区14个地面国际交换站观测的7项气象数据,以时间卷积网络(TCN)模型为基础模型,运用K-近邻(KNN)算法对蒸发皿蒸发... 蒸发量的精确预测对合理开发利用水资源、旱涝变化趋势研究和农作物灌溉用水量的估算具有十分重要的意义。选取我国北方地区14个地面国际交换站观测的7项气象数据,以时间卷积网络(TCN)模型为基础模型,运用K-近邻(KNN)算法对蒸发皿蒸发量的空间因素进行筛选,构建KNN-TCN蒸发皿蒸发量预测模型,并利用平均绝对误差、均方根误差和判定系数3项指标对目标站点的蒸发量预测精度进行评价。结果表明:1)KNN-TCN模型预测结果明显优于LSTM模型;2)相比基础TCN模型,KNN-TCN模型预测结果的判定系数提升了2.52%,平均绝对误差、均方根误差分别降低了23.97%、13.06%。 展开更多
关键词 蒸发皿蒸发量 时间卷积网络 k-近邻算法 空间因素
下载PDF
基于投票加权GS-KNN的离心风机故障诊断
14
作者 曾学文 陈高超 +2 位作者 付名江 邵峰 伍仁杰 《节能》 2024年第1期47-50,共4页
风机作为火力发电的重要辅机,对其进行及时高效的故障诊断,可有效减少停机损失,提高火力发电效率。k近邻(KNN)对非平稳数据样本有良好的分类能力。为了改进传统KNN算法存在的缺陷,构建投票加权网格搜索-k近邻算法(投票加权GS-KNN)故障... 风机作为火力发电的重要辅机,对其进行及时高效的故障诊断,可有效减少停机损失,提高火力发电效率。k近邻(KNN)对非平稳数据样本有良好的分类能力。为了改进传统KNN算法存在的缺陷,构建投票加权网格搜索-k近邻算法(投票加权GS-KNN)故障诊断模型,利用网格搜索完成k值的选取,基于前k个近邻构建与距离值呈负相关的权值投票公式,依据投票得分情况进行故障诊断。使用投票加权GS-KNN模型对离心风机常见的9种运行状态进行故障诊断,拟合k值与准确率的关系,诊断准确率可达到100%。 展开更多
关键词 故障诊断 火力发电 网格搜索 k近邻算法 投票加权
下载PDF
Word2Vec-KNN技术支持下潮流玩具质量检测模型研究
15
作者 吕远智 《计算机应用文摘》 2024年第10期92-94,共3页
随着人们生活水平的提高,越来越多的消费者更加注重所购产品的质量,特别是在儿童玩具方面。质量不合格的玩具产品会给儿童带来诸多影响,包括但不限于安全隐患及对儿童健康产生的影响。然而,工业制造中的产品质量检测报告种类繁多且不易... 随着人们生活水平的提高,越来越多的消费者更加注重所购产品的质量,特别是在儿童玩具方面。质量不合格的玩具产品会给儿童带来诸多影响,包括但不限于安全隐患及对儿童健康产生的影响。然而,工业制造中的产品质量检测报告种类繁多且不易被理解,无法直观体现产品质量。因此,文章提出了一种基于Word2Vec与K最近邻分类算法相结合的产品质量评估模型。该模型能够通过产品质量报告对某玩具进行评估,从而判断其质量。实验结果表明,在数据集尺寸达到900时,K均值聚类算法模型、局部加权最近邻算法模型和混合模型算法模型的准确率分别为0.84,0.91与0.96,损失函数值分别为0.07,0.05及0.03,证明所提模型能够对玩具产品进行准确评估,从而为消费者和质量监管部门提供一定的决策支持。 展开更多
关键词 产品质量评估 k最近邻 Word2Vec 大数据
下载PDF
基于WT-kNN的沥青混凝土心墙坝渗流监测数据异常检测
16
作者 毛建刚 阿尔娜古丽·艾买提 +1 位作者 颜志光 廖攀 《西北水电》 2024年第3期54-60,共7页
安全监测数据的质量,对沥青混凝土心墙坝安全状况分析具有重要意义。时间效应导致的趋势性问题是渗流监测数据异常检测的难点。模态分解方法能较好地对时间序列的趋势项进行分离,进而识别处异常信号。但是,土石坝渗流监测数据中的异常... 安全监测数据的质量,对沥青混凝土心墙坝安全状况分析具有重要意义。时间效应导致的趋势性问题是渗流监测数据异常检测的难点。模态分解方法能较好地对时间序列的趋势项进行分离,进而识别处异常信号。但是,土石坝渗流监测数据中的异常值和真实信号往往存在模态混叠。为了解决上述问题,通过引入了小波变换结合局部kNN加权回归(WT-kNN)异常检测方法,使用连续小波变换分离趋势项,通过局部kNN加权回归进一步对小波变换的检测结果进行筛选,提高模型的异常检测准确率。工程应用结果表明:对于粗差占比2.5%~10%的监测序列,WT-kNN的召回率均高于95%,误判率低于5%;该模型与WT-MAD方法和SSA-DBSCAN方法对比实验验证了WT-kNN的有效性和优越性。敏感性分析结果表明,提出模型对异常值数量占总数据量比例和异常值波动范围大小敏感性低,可为后续监测数据分析处理及预测预警建立基础。 展开更多
关键词 小波变换 局部k近邻算法 大坝安全监测 异常检测
下载PDF
基于不规则区域划分方法的k-Nearest Neighbor查询算法 被引量:1
17
作者 张清清 李长云 +3 位作者 李旭 周玲芳 胡淑新 邹豪杰 《计算机系统应用》 2015年第9期186-190,共5页
随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细... 随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细介绍了一种基于不规则区域划分方法的改进型k NN查询算法,并利用对大规模数据集进行分布式并行计算的模型Map Reduce对该算法加以实现.实验结果与分析表明,Map Reduce框架下基于不规则区域划分方法的k NN查询算法可以获得较高的数据处理效率,并可以较好的支持大数据环境下数据的高效查询. 展开更多
关键词 k-nearest neighbor(k NN)查询算法 不规则区域划分方法 MAP REDUCE 大数据
下载PDF
Mapping aboveground biomass by integrating geospatial and forest inventory data through a k-nearest neighbor strategy in North Central Mexico 被引量:3
18
作者 Carlos A AGUIRRE-SALADO Eduardo J TREVIO-GARZA +7 位作者 Oscar A AGUIRRE-CALDERóN Javier JIMNEZ-PREZ Marco A GONZLEZ-TAGLE José R VALDZ-LAZALDE Guillermo SNCHEZ-DíAZ Reija HAAPANEN Alejandro I AGUIRRE-SALADO Liliana MIRANDA-ARAGóN 《Journal of Arid Land》 SCIE CSCD 2014年第1期80-96,共17页
As climate change negotiations progress,monitoring biomass and carbon stocks is becoming an important part of the current forest research.Therefore,national governments are interested in developing forest-monitoring s... As climate change negotiations progress,monitoring biomass and carbon stocks is becoming an important part of the current forest research.Therefore,national governments are interested in developing forest-monitoring strategies using geospatial technology.Among statistical methods for mapping biomass,there is a nonparametric approach called k-nearest neighbor(kNN).We compared four variations of distance metrics of the kNN for the spatially-explicit estimation of aboveground biomass in a portion of the Mexican north border of the intertropical zone.Satellite derived,climatic,and topographic predictor variables were combined with the Mexican National Forest Inventory(NFI)data to accomplish the purpose.Performance of distance metrics applied into the kNN algorithm was evaluated using a cross validation leave-one-out technique.The results indicate that the Most Similar Neighbor(MSN)approach maximizes the correlation between predictor and response variables(r=0.9).Our results are in agreement with those reported in the literature.These findings confirm the predictive potential of the MSN approach for mapping forest variables at pixel level under the policy of Reducing Emission from Deforestation and Forest Degradation(REDD+). 展开更多
关键词 k-nearest neighbor Mahalanobis most similar neighbor MODIS BRDF-adjusted reflectance forest inventory the policy of Reducing Emission from Deforestation and Forest Degradation
下载PDF
Support Vector Machine-Based Fault Diagnosis of Power Transformer Using k Nearest-Neighbor Imputed DGA Dataset 被引量:4
19
作者 Zahriah Binti Sahri Rubiyah Binti Yusof 《Journal of Computer and Communications》 2014年第9期22-31,共10页
Missing values are prevalent in real-world datasets and they may reduce predictive performance of a learning algorithm. Dissolved Gas Analysis (DGA), one of the most deployable methods for detecting and predicting inc... Missing values are prevalent in real-world datasets and they may reduce predictive performance of a learning algorithm. Dissolved Gas Analysis (DGA), one of the most deployable methods for detecting and predicting incipient faults in power transformers is one of the casualties. Thus, this paper proposes filling-in the missing values found in a DGA dataset using the k-nearest neighbor imputation method with two different distance metrics: Euclidean and Cityblock. Thereafter, using these imputed datasets as inputs, this study applies Support Vector Machine (SVM) to built models which are used to classify transformer faults. Experimental results are provided to show the effectiveness of the proposed approach. 展开更多
关键词 MISSING VALUES Dissolved Gas Analysis Support Vector Machine k-nearest neighborS
下载PDF
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 被引量:4
20
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《Journal of Data Analysis and Information Processing》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 Classification Algorithms NON-PARAMETRIC k-nearest-neighbor Neural Networks Random Forest Support Vector Machines
下载PDF
上一页 1 2 112 下一页 到第
使用帮助 返回顶部