期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于随机森林结合前向序列选择算法的铁路隧道防水板检测数据关键影响因素识别 被引量:3
1
作者 侯秀林 李世林 +1 位作者 张宪清 姜惠峰 《铁道建筑》 北大核心 2022年第2期131-136,共6页
针对参数特征复杂度高的铁路产品,提出了一种基于随机森林(RF)结合前向序列选择(SFS)算法的铁路产品检验检测数据关键影响因素识别方法,以辅助基于经验的识别方法。创新使用RF-SFS算法,将其应用于铁路隧道防水板检验检测数据关键影响因... 针对参数特征复杂度高的铁路产品,提出了一种基于随机森林(RF)结合前向序列选择(SFS)算法的铁路产品检验检测数据关键影响因素识别方法,以辅助基于经验的识别方法。创新使用RF-SFS算法,将其应用于铁路隧道防水板检验检测数据关键影响因素的识别研究。根据多年铁路隧道防水板检测数据,建立RF模型,获得了影响铁路隧道防水板检测结果的特征关键性评分序列。随后,结合SFS方法得出关键性评分序列的阈值,将排名前6位的影响因素识别为关键特征,模型的预测能力达到99.98%。为验证关键特征识别方法的有效性,对比分析3种模型在使用不同特征子集时的预测能力。当仅选用关键特征时,3种模型的预测能力均达到最佳,加入冗余特征后模型的预测能力逐渐降低。 展开更多
关键词 铁路隧道 随机森林 序列选择 预测模型 防水板 影响因素 前向序列选择
下载PDF
基于多准则决策的不平衡感知数据集成特征选择算法
2
作者 王刚 任丽萍 +1 位作者 方力 徐维磊 《传感器技术与应用》 2023年第6期538-549,共12页
在数据挖掘领域,不平衡数据普遍存在。在许多情况下,这些数据通常具有高维性和类不平衡性。不平衡数据集特征属性分布失衡,会造成分类性能下降,数据的高维性则会导致学习算法非常耗时。针对这一问题,提出了一种基于组合采样和集成学习... 在数据挖掘领域,不平衡数据普遍存在。在许多情况下,这些数据通常具有高维性和类不平衡性。不平衡数据集特征属性分布失衡,会造成分类性能下降,数据的高维性则会导致学习算法非常耗时。针对这一问题,提出了一种基于组合采样和集成学习的特征选择方法。首先使用组合采样方法,处理类不平衡问题,重点合成少数类样本,在保证数据集达到平衡的前提下去除噪声样本,将集成特征选择建模为一个多准则决策过程,使用VIKOR方法得到特征重要性排序,然后在序列前向搜索特征的过程中,使用XGBoost算法的准确率作为评估特征子集优劣的指标,确定最优特征子集。选择AUC、G-mean和F-measure作为评价指标,通过在5组不平衡数据集进行实验,证实了所提算法具有更好的分类效果,且模型的鲁棒性更好。 展开更多
关键词 不平衡数据分类 组合采样 多准则决策 VIKOR法 前向序列选择
下载PDF
基于朴素贝叶斯的鼠标轨迹识别方法 被引量:3
3
作者 谢苗 刘琳岚 《信息通信》 2018年第9期30-32,共3页
拖动滑块验证是行为式验证码的主要方式之一。针对鼠标轨迹的识别问题,提出一种基于朴素贝叶斯的鼠标轨迹识别方法。通过比较人为轨迹和机器轨迹的差异,提取出鼠标轨迹的10个初始特征:是否回移、尾部平均速度、轨迹右半部的轨迹点密度等... 拖动滑块验证是行为式验证码的主要方式之一。针对鼠标轨迹的识别问题,提出一种基于朴素贝叶斯的鼠标轨迹识别方法。通过比较人为轨迹和机器轨迹的差异,提取出鼠标轨迹的10个初始特征:是否回移、尾部平均速度、轨迹右半部的轨迹点密度等,构建了基于朴素贝叶斯的鼠标轨迹识别模型;采用前向序列选择算法从10个特征中找出包括8个特征的最优特征子集,采用相关概率加权方法为每个特征赋予权值,得到改进的鼠标轨迹识别模型。实验在MATLAB仿真器中进行,使用了2017年腾讯大数据挑战赛提供的鼠标轨迹数据集。仿真实验表明,与支持向量机识别模型、决策树识别模型、K最近邻识别模型相比,文章提出的改进模型具有更高的识别准确率。 展开更多
关键词 鼠标轨迹 朴素贝叶斯 特征提取 前向序列选择算法 相关概率加权方法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部