-
题名基于改进Smote-GBDT算法的岩爆预测模型
被引量:1
- 1
-
-
作者
宋英华
江晨
李墨潇
齐石
-
机构
武汉理工大学中国应急管理研究中心
武汉理工大学安全科学与应急管理学院
-
出处
《中国安全科学学报》
CAS
CSCD
北大核心
2023年第9期25-32,共8页
-
基金
国家自然科学基金资助(52209146)。
-
文摘
为准确预测岩爆等级,确保施工人员和设备安全,首先,从岩爆机制、数据和算法角度,分析埋深(D)、单轴抗压强度(UCS)、单轴抗拉强度(UTS)、岩石脆性指数(B_(1)、B_(2))、围岩最大切向应力(MTS)、应力集中系数(SCF)和弹性变形能指数(W_(et))8个指标,建立岩爆预测指标体系;其次,针对岩爆样本存在的数据不均衡问题,引进托梅克联系(Tomek Link)对欠采样方法,改进合成少数类过采样(Smote)算法,对岩爆训练样本进行混合过采样;最后,构建SmoteTomek-梯度提升树(GBDT)岩爆预测模型,以38组数据验证模型的有效性,并与其他模型进行对比。结果表明:SmoteTomek-GBDT的准确率为92.1%,较未采样提升5.3%,Smote采样提升10.5%,优于随机过采样模型,并且避免跨等级的岩爆误判。
-
关键词
岩爆预测
梯度提升树(GBDT)算法
合成少数类过采样(Smote)算法
岩爆指标
托梅克联系(tomek
Link)
-
Keywords
rockburst prediction
gradient boosting decision tree(GBDT)
synthetic minority oversampling technique(Smote)
rockburst index
tomek Link
-
分类号
X936
[环境科学与工程—安全科学]
-
-
题名基于CNN与BiGRU融合神经网络的入侵检测模型
被引量:13
- 2
-
-
作者
张安琳
张启坤
黄道颖
刘江豪
李建春
陈孝文
-
机构
郑州轻工业大学工程训练中心
郑州轻工业大学计算机与通信工程学院
-
出处
《郑州大学学报(工学版)》
CAS
北大核心
2022年第3期37-43,共7页
-
基金
国家自然科学基金资助项目(61772477)。
-
文摘
针对深度学习入侵检测中出现的数据类不平衡及特征学习不全面等问题,提出了一种基于卷积神经网络(CNN)与双向门控循环单元(BiGRU)融合的神经网络入侵检测模型。通过SMOTE-Tomek算法完成对数据集的平衡处理,使用基于平均不纯度减少的特征重要性算法实现特征选择,将CNN和BiGRU模型进行特征融合并引入注意力机制进行特征提取,从而提高模型的总体检测性能。使用入侵检测数据集CSE-CIC-IDS2018进行多分类实验,并与经典单一深度学习模型进行对比。实验结果表明:在数据集平衡方面,经SMOTE-Tomek算法处理,DoS attacks-Slow HTTP Test识别准确率从0提升至34.66%,SQL Injection识别准确率从0提升至100%,DDoS attack-LOIC-UDP、Brute Force-Web和Brute Force-XSS分别提升了5.22百分点、6.55百分点和35.71百分点,证明了平衡后的数据集较未经过处理的数据集在少数类的识别精度上提升明显。在模型的总体检测性能方面,在多分类实验对比中,所提模型总的分类精确率、召回率以及F1值均高于其他几种单一神经网络模型。其中各攻击流量类别的总评精确率比LSTM模型提升了2.10百分点;总评召回率比LSTM模型提升了1.50百分点;总评F1值比GRU模型提升了1.97百分点,从而证明了该模型具有更好的检测效果。
-
关键词
入侵检测
卷积神经网络
双向门控循环单元
SMOTE算法
tomek
links算法
-
Keywords
intrusion detection
convolutional neural networks
bidirectional gated recurrent unit
synthetic minority over-sampling technique algorithm
tomek links algorithm
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于深度森林和DNA甲基化的癌症分类研究
被引量:8
- 3
-
-
作者
刘超
吴申
郑一超
侯维岩
-
机构
郑州大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第13期189-193,共5页
-
基金
国家自然科学基金(No.81602961)。
-
文摘
作为人类基因组重要的表观遗传现象,DNA甲基化对基因的表达发挥着重要的调控作用,与癌症的关系密切。针对癌症基因组图谱(TCGA)庞大数据的类不平衡和高维度,致使假阴率大幅增加的问题,提出了一种混合采样的不平衡数据集成分类算法,使用合成少数过采样(SMOTE)算法生成新的少数类样本,得到扩充后的数据集,通过Tomek Link算法剔除样本扩充过程中引入的噪声,得到相对平衡的数据集。在此基础上,利用深度森林(gcForest)算法的级联森林结构,每一层选取两种随机森林结构,以增强模型的泛化能力,得到最终的分类模型。对6种癌症的DNA甲基化数据实验表明混合采样的不平衡数据集成分类算法在保证多数类分类精度的前提下,有效地提高了对于少数类的灵敏度。
-
关键词
DNA甲基化
癌症基因组图谱(TCGA)
合成少数类采样技术(SMOTE)
tomek
Link算法
gcForest算法
-
Keywords
DNA methylation
The Cancer Genome Atlas(TCGA)
Synthetic Minority Oversampling Technique(SMOTE)
tomek Link algorithm
gcForest algorithm
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP391
[自动化与计算机技术—计算机应用技术]
-