期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于RSIV-RF模型的凉山州泥石流易发性评价
1
作者 饶姗姗 冷小鹏 《地质科技通报》 CAS CSCD 北大核心 2024年第1期275-287,共13页
针对随机森林(RF)模型进行泥石流易发性评价过程中存在连续型因子依靠主观意识分级、随机选取的非泥石流样本准确度较低等问题,以位于四川西南部的凉山彝族自治州为研究区,提出基于统计学先验模型抽样的随机森林对研究区进行泥石流易发... 针对随机森林(RF)模型进行泥石流易发性评价过程中存在连续型因子依靠主观意识分级、随机选取的非泥石流样本准确度较低等问题,以位于四川西南部的凉山彝族自治州为研究区,提出基于统计学先验模型抽样的随机森林对研究区进行泥石流易发性评价分区。利用累计灾害频率等曲线的相对变化对连续型因子进行分级处理;采用粗糙集理论(RS)和信息量法(IV)计算加权信息量值,划定极低和低易发性区并从中选择负样本数据。通过袋外误差(OOB)变化曲线确定RF模型的最佳树棵数n_estimators和分裂特征数max_features,随后构建加权信息量-随机森林(RSIV-RF)模型预测凉山州泥石流易发性。进一步地,与从全区随机选择非泥石流样本的RF模型开展对比研究。结果表明,训练集和测试集下RSIV-RF模型的准确度分别为0.89,0.83,且对应的ROC曲线的AUC值分别为0.920,0.895,均高于单独的RF模型;RSIV-RF绘制的泥石流易发性评价图与历史灾害分布较为一致,较高和高易发性等级区域占研究区面积比为18.625%,包含了78.57%的泥石流点。性能评估和易发性统计结果均表明基于RSIV-RF能够解决单独模型存在的非泥石样本采样不准确的问题,其泥石流易发性预测精度更高,在凉山州地区泥石流易发性评价研究中具有较好的适应性。 展开更多
关键词 随机森林(RF) 不平衡数据集 加权信息量(RSIV) 泥石流 RSIV-RF模型 凉山州 易发性评价
下载PDF
基于AD-RF模型的互联网金融信用风险评估
2
作者 陈为民 刘述权 +1 位作者 龙小凡 高大良 《洛阳理工学院学报(社会科学版)》 2023年第2期38-42,共5页
基于互联网金融平台非平衡交易记录数据样本,利用“软信息”特征构建评估指标体系,结合ADASYN算法和随机森林模型,提出改进后的AD-RF信用风险评估模型。该信用风险评估模型优于传统随机森林模型。互联网金融面临的信用风险主要源于对借... 基于互联网金融平台非平衡交易记录数据样本,利用“软信息”特征构建评估指标体系,结合ADASYN算法和随机森林模型,提出改进后的AD-RF信用风险评估模型。该信用风险评估模型优于传统随机森林模型。互联网金融面临的信用风险主要源于对借款人的道德水平高低、还款能力大小、违约成本大小的未知和借款利率的变化。 展开更多
关键词 互联网金融 信用风险评估 AD-RF模型非平衡数据 ADASYN算法 随机森林模型
下载PDF
基于BTS数据集的航班延误分类和预测算法
3
作者 郭海州 杨晶晶 +2 位作者 吴季达 张彬 黄铭 《科学技术与工程》 北大核心 2023年第12期5304-5311,共8页
针对神经网络分类模型对美国联邦运输统计局(Bureau of Transportation Statistics,BTS)航班数据集中的不均衡数据预测误差较大的问题,采用自适应合成采样算法(adaptive synthetic sampling approach,ADASYN)和合成少数类过采样算法(syn... 针对神经网络分类模型对美国联邦运输统计局(Bureau of Transportation Statistics,BTS)航班数据集中的不均衡数据预测误差较大的问题,采用自适应合成采样算法(adaptive synthetic sampling approach,ADASYN)和合成少数类过采样算法(synthetic minority over-sampling technique,SMOTE)对航班延误类别进行平衡处理,并用随机森林(random forest,RF)模型进行训练和贝叶斯调参。结果表明:与不经过平衡采样的方法比较,该方法在权重平均下的精确率、召回率和F 1评分分别提高了19%、8%和16%;分类预测准确率提升8.03%,模型拟合指数AUC(area under curve)提升5.4%。同时,采用多特征相融合的图神经网络模型Graph WaveNet对航班平均延误时间进行预测。实验结果表明:与单特征模型比较,该模型平均绝对误差和均方根误差分别降低了16%和12.45%。这些方法和结果对研究航班延误分类和预测算法研究具有参考价值。 展开更多
关键词 不平衡分类数据 平衡采样算法 随机森林(RF)模型 图神经网络 特征融合
下载PDF
基于改进随机森林集成模型的疾病风险预测 被引量:1
4
作者 李丹 卢琰 +2 位作者 吴佩珊 李春玲 杜宝林 《实验室研究与探索》 CAS 北大核心 2023年第9期95-99,109,共6页
针对疾病样本数据集不均衡以及传统模型预测精度低等问题,提出一种混合随机森林与人工神经网络(ANN)的集成预测模型。采用少数样本合成过采样技术(SMOTE)构建平衡训练数据集;结合随机森林特征选择优势和ANN的预测能力,通过集成方法构建... 针对疾病样本数据集不均衡以及传统模型预测精度低等问题,提出一种混合随机森林与人工神经网络(ANN)的集成预测模型。采用少数样本合成过采样技术(SMOTE)构建平衡训练数据集;结合随机森林特征选择优势和ANN的预测能力,通过集成方法构建混合随机森林与ANN的集成预测模型SMOTE-HRF-ANN以对畜禽疾病风险进行预警预测;将多种预测模型进行对比实验。实验结果表明,该模型能有效提高疾病预测的精准度与召回率,在少数类样本中的精确率和F1-score值分别达到96%和85%。 展开更多
关键词 畜禽疾病风险预测 非均衡数据 集成模型 随机森林
下载PDF
REML法和Bayesian法对小样本不平衡单因素随机效应模型方差成分估计的模拟比较分析 被引量:4
5
作者 董沾健 赵耐青 林燧恒 《中国卫生统计》 CSCD 北大核心 2009年第1期35-37,40,共4页
目的比较限制性极大似然估计(REML)法和贝叶斯法(Bayesian)对小样本不平衡单因素随机效应模型方差成分估计的偏差和精密度,同时考虑在样本量的大小、单位的数量和单位内相关系数(ICC)的大小不同的情况下对方差成分估计的精确程度的影响... 目的比较限制性极大似然估计(REML)法和贝叶斯法(Bayesian)对小样本不平衡单因素随机效应模型方差成分估计的偏差和精密度,同时考虑在样本量的大小、单位的数量和单位内相关系数(ICC)的大小不同的情况下对方差成分估计的精确程度的影响。方法通过计算机模拟7组不同设计的数据集,用SAS软件MIXED模块进行方差成分估计。结果不同的设计中,REML法估计比Bayesian法估计更加接近真值,但Bayesian法对组间方差的区间估计更加精密。对于两种方法而言,样本和单位数量的增加,估计结果更加准确。组内方差的估计,比组间方差的估计更准确和精密。结论对小样本不平衡结构数据,当ICC为小或中等时,REML估计比Bayesian估计的偏差和均方误差要小,推荐使用。但是Bayesian法的区间估计比REML法的区间估计更加精密。 展开更多
关键词 不平衡单因素随机效应模型 方差成分 限制性极大似然 贝叶斯
下载PDF
一种处理非平衡数据集的优化随机森林分类方法 被引量:10
6
作者 马海荣 程新文 《微电子学与计算机》 CSCD 北大核心 2018年第11期28-32,共5页
利用传统随机森林(random forest,RF)模型进行分类时存在分类精度受不平衡样本集的影响,以及投票平局现象会导致算法停滞等问题.本文对RF模型进行了优化改进,首先随机抽取等量的少数类与多数类样本构建训练样本集进行RF建模,然后根据投... 利用传统随机森林(random forest,RF)模型进行分类时存在分类精度受不平衡样本集的影响,以及投票平局现象会导致算法停滞等问题.本文对RF模型进行了优化改进,首先随机抽取等量的少数类与多数类样本构建训练样本集进行RF建模,然后根据投票熵与基于样本特征参数的广义欧几里得距离逐步添加具有最大投票熵的样本到训练样本集,解决传统RF模型随机抽取样本时训练样本集中包含不同类别样本数不平衡问题.对于分类过程中可能出现投票结果的平局现象,利用测试样本与邻近训练样本的广义欧几里得距离决定其分类结果,以消除投票平局现象造成的停滞问题.实验结果表明,本文优化RF模型对于非平衡数据集的分类可以取得较好的分类结果. 展开更多
关键词 随机森林 最大投票熵 广义欧几里得距离 不平衡数据集
下载PDF
基于特征组分层与半监督学习的鼠标轨迹识别 被引量:1
7
作者 康璐璐 范兴容 +2 位作者 王茜竹 杨晓雅 明蕊 《计算机工程》 CAS CSCD 北大核心 2021年第4期277-284,共8页
传统时间序列分类方法存在鼠标轨迹特征挖掘不充分、数据不平衡与标记样本量少等问题,造成识别效果较差。结合特征组分层和半监督学习,提出一种鼠标轨迹识别方法。通过不同视角构建有层次的鼠标轨迹特征组,并借鉴半监督学习的思想,利用... 传统时间序列分类方法存在鼠标轨迹特征挖掘不充分、数据不平衡与标记样本量少等问题,造成识别效果较差。结合特征组分层和半监督学习,提出一种鼠标轨迹识别方法。通过不同视角构建有层次的鼠标轨迹特征组,并借鉴半监督学习的思想,利用多个随机森林模型对未标记样本进行伪标记,且将抽取标签预测一致且置信度较高的部分样本加入到训练集中。基于基础特征组和辅助特征组,在扩充后的训练集上训练随机森林模型,以实现鼠标轨迹的人机识别。实验结果表明,该方法可有效识别鼠标轨迹,且精确率、召回率与调和均值分别达到97.83%、94.72%和96.56%。 展开更多
关键词 鼠标轨迹识别 特征组分层 半监督学习 随机森林模型 不平衡数据
下载PDF
非平衡网络环境下基于身份的组密钥交换协议 被引量:1
8
作者 袁思敏 马传贵 相生奇 《计算机应用》 CSCD 北大核心 2015年第5期1399-1405,共7页
针对参与者计算能力不均衡的非平衡无线网络环境,首先对基于身份的群组认证密钥协商(ID-AGKA)协议进行安全性分析,指出该协议不能抵抗临时密钥泄露攻击;随后通过对该协议签名的生成方式进行改进,使得改进的协议不仅在安全性上有所提高,... 针对参与者计算能力不均衡的非平衡无线网络环境,首先对基于身份的群组认证密钥协商(ID-AGKA)协议进行安全性分析,指出该协议不能抵抗临时密钥泄露攻击;随后通过对该协议签名的生成方式进行改进,使得改进的协议不仅在安全性上有所提高,而且能有效减少计算代价和通信代价,因此更适用于非平衡无线网络;同时,协议采用了指定验证者签名,能有效地解决签名者的隐私问题;此外,对非平衡网络中群组密钥协商协议的动态机制进行改进,通过高能量节点合理利用用户动态变化前计算的信息来减少低能量节点不必要的计算,这一改进能极大减少低能量节点的计算代价,更符合实际需求;最后,在随机预言模型中基于整除判定性Diffie-Hellman(DDDH)假设证明了改进的群组密钥协商(GKA)协议的安全性。 展开更多
关键词 非平衡无线网络 群组密钥协商 临时密钥泄露攻击 指定验证者签名 动态机制 随机预言模型
下载PDF
非平衡单向分类模型中方差分量的Stein型区间估计
9
作者 党晓晶 孙同贺 《内蒙古科技大学学报》 CAS 2020年第4期307-311,328,共6页
在非平衡单向分类模型中,常规方差分量的区间估计都是以组间平方和与组内平方和为统计量,通过引入包含组间方差分量信息的统计量USS,将均值与平方和的线性组合作为新的统计量.改进后的区间估计与传统的最小长度区间估计相比,长度不变但... 在非平衡单向分类模型中,常规方差分量的区间估计都是以组间平方和与组内平方和为统计量,通过引入包含组间方差分量信息的统计量USS,将均值与平方和的线性组合作为新的统计量.改进后的区间估计与传统的最小长度区间估计相比,长度不变但置信度更高. 展开更多
关键词 非平衡单向分类模型 置信区间 方差分量 STEIN
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部