期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
代价敏感惩罚AdaBoost算法的非平衡数据分类 被引量:4
1
作者 鲁淑霞 张振莲 翟俊海 《南京航空航天大学学报》 CAS CSCD 北大核心 2023年第2期339-346,共8页
针对非平衡数据分类问题,提出了一种基于代价敏感的惩罚AdaBoost算法。在惩罚Adaboost算法中,引入一种新的自适应代价敏感函数,赋予少数类样本及分错的少数类样本更高的代价值,并通过引入惩罚机制增大了样本的平均间隔。选择加权支持向... 针对非平衡数据分类问题,提出了一种基于代价敏感的惩罚AdaBoost算法。在惩罚Adaboost算法中,引入一种新的自适应代价敏感函数,赋予少数类样本及分错的少数类样本更高的代价值,并通过引入惩罚机制增大了样本的平均间隔。选择加权支持向量机(Support vector machine,SVM)优化模型作为基分类器,采用带有方差减小的随机梯度下降方法(Stochastic variance reduced gradient,SVRG)对优化模型进行求解。对比实验表明,本文提出的算法不但在几何均值(G-mean)和ROC曲线下的面积(Area under ROC curve,AUC)上明显优于其他算法,而且获得了较大的平均间隔,显示了本文算法在处理非平衡数据分类问题上的有效性。 展开更多
关键词 非平衡数据 惩罚AdaBoost 自适应代价敏感函数 平均间隔 随机梯度下降
下载PDF
基于代价敏感卷积神经网络的非平衡问题混合方法 被引量:3
2
作者 黄颖琦 陈红梅 《计算机科学》 CSCD 北大核心 2021年第9期77-85,共9页
非平衡问题是数据挖掘领域中普遍存在的一个问题,数据的偏态分布会使得分类器的分类效果不理想。卷积神经网络作为一种高效的数据挖掘工具,被广泛应用于分类任务,但其训练过程若受到数据非平衡的不利影响,则将导致少数类的分类准确率下... 非平衡问题是数据挖掘领域中普遍存在的一个问题,数据的偏态分布会使得分类器的分类效果不理想。卷积神经网络作为一种高效的数据挖掘工具,被广泛应用于分类任务,但其训练过程若受到数据非平衡的不利影响,则将导致少数类的分类准确率下降。针对二分类非平衡数据分类问题,文中提出了一种基于代价敏感卷积神经网络的非平衡问题混合方法。首先将密度峰值聚类算法与SMOTE相结合,通过过采样对数据进行预处理,降低原始数据集的不平衡程度;然后利用代价敏感思想对非平衡数据中的不同类别给予不同权重,并考虑预测值与标签值之间的欧氏距离,对非平衡数据中多数类和少数类赋予不同的代价损失,构建代价敏感卷积神经网络模型,以提高卷积神经网络对少数类的识别率。选取6个不同的数据集,用于验证所提方法的有效性。实验结果表明,所提方法可以提高卷积神经网络模型对非平衡数据的分类性能。 展开更多
关键词 非平衡问题 卷积神经网络 过采样 数据预处理 代价敏感损失函数
下载PDF
基于改进XGBoost模型的网络入侵检测研究
3
作者 苏凯旋 《计算机与现代化》 2024年第6期109-114,共6页
为了提升传统的网络入侵检测模型的检测准确性和实用性,本文提出一种基于改进梯度提升树(XGBoost)模型的网络入侵检测方法。首先,采用随机森林算法预计关键特征点,在数据的预处理阶段有效地选取了重要性权重最高的特征并构建特征集合;其... 为了提升传统的网络入侵检测模型的检测准确性和实用性,本文提出一种基于改进梯度提升树(XGBoost)模型的网络入侵检测方法。首先,采用随机森林算法预计关键特征点,在数据的预处理阶段有效地选取了重要性权重最高的特征并构建特征集合;其次,利用卡单方程改进了XGBoost模型的预测方法;最后,在XGBoost优化算法中引入代价敏感函数来提升算法对小样本数据的检测率,应用网格法调参减少模型复杂性。实验结果表明,与其它人工智能算法对比,所提出的模型在具有更高检验精度的情况下降低了50%以上等待时间,并且在噪音环境下具有较强的可扩展性和自适应性,并结合其他模型设置参数消融实验,实验结果表明树深对模型性能影响最大。 展开更多
关键词 入侵检测 特征选择 随机森林 XGBoost 代价敏感函数
下载PDF
基于最优间隔的AdaBoost_(v)算法的非平衡数据分类 被引量:3
4
作者 鲁淑霞 张振莲 《计算机科学》 CSCD 北大核心 2021年第11期184-191,共8页
为了解决非平衡数据分类问题,提出了一种基于最优间隔的AdaBoost v算法。该算法采用改进的SVM作为基分类器,在SVM的优化模型中引入间隔均值项,并根据数据非平衡比对间隔均值项和损失函数项进行加权;采用带有方差减小的随机梯度方法(Stoc... 为了解决非平衡数据分类问题,提出了一种基于最优间隔的AdaBoost v算法。该算法采用改进的SVM作为基分类器,在SVM的优化模型中引入间隔均值项,并根据数据非平衡比对间隔均值项和损失函数项进行加权;采用带有方差减小的随机梯度方法(Stochastic Variance Reduced Gradient,SVRG)对优化模型进行求解,以加快收敛速度。所提基于最优间隔的AdaBoost v算法在样本权重更新公式中引入了一种新的自适应代价敏感函数,赋予少数类样本、误分类的少数类样本以及靠近决策边界的少数类样本更高的代价值;另外,通过结合新的权重公式以及引入给定精度参数v下的最优间隔的估计值,推导出新的基分类器权重策略,进一步提高了算法的分类精度。对比实验表明,在线性和非线性情况下,所提基于最优间隔的AdaBoost v算法在非平衡数据集上的分类精度优于其他算法,且能获得更大的最小间隔。 展开更多
关键词 非平衡数据 SVRG AdaBoost_(v) 最优间隔 自适应代价敏感函数
下载PDF
基于随机森林和XGBoost的网络入侵检测模型 被引量:22
5
作者 陈卓 吕娜 《信号处理》 CSCD 北大核心 2020年第7期1055-1064,共10页
为提高复杂网络环境中入侵检测模型的准确性和实时性,提出一种基于随机森林和极端梯度提升树(XGBoost)的网络入侵检测模型RF-XGB。首先针对随机森林算法计算特征重要性的特点,设计混合特征选择方法高效筛选出最有价值的特征子集;在XGBo... 为提高复杂网络环境中入侵检测模型的准确性和实时性,提出一种基于随机森林和极端梯度提升树(XGBoost)的网络入侵检测模型RF-XGB。首先针对随机森林算法计算特征重要性的特点,设计混合特征选择方法高效筛选出最有价值的特征子集;在XGBoost算法中引入代价敏感函数来提高对少样本类别的检测率,使用网格法调参降低模型复杂度。实验仿真结果表明,与其他机器学习算法相比,所提出的模型在具备更高检测精度的情况下减少了50%以上的处理时间,并在噪声影响下具有较好的鲁棒性和自适应性。 展开更多
关键词 入侵检测 特征选择 随机森林 极端梯度提升树 代价敏感函数
下载PDF
基于深度自编码网络的运动目标检测 被引量:9
6
作者 徐培 蔡小路 +1 位作者 何文伟 谢易道 《计算机应用》 CSCD 北大核心 2014年第10期2934-2937,2962,共5页
针对从动态背景中提取前景效果较差的问题,提出了一种基于深度自编码网络的运动目标检测方法。首先,用一个三层的深度自编码网络从视频图像中提取不包含运动目标的背景图像,将背景图像作为变量构造了深度自编码网络的代价函数;然后,构... 针对从动态背景中提取前景效果较差的问题,提出了一种基于深度自编码网络的运动目标检测方法。首先,用一个三层的深度自编码网络从视频图像中提取不包含运动目标的背景图像,将背景图像作为变量构造了深度自编码网络的代价函数;然后,构造了一个分离函数得到了输入图像的背景图像,再用另一个三层的深度自编码网络学习提取出的背景图像;为了使深度自编码网络的学习能够在线地提取运动目标,还提出了一种在线学习算法,通过寻找对代价函数敏感度较低的权重进行合并,从而能够对更多的视频图像进行处理。实验结果表明,所提方法在从动态背景中提取出前景运动目标上相比Lu等的前景检测的工作(LU C,SHI J,JIA J.Online robust dictionary learning.Proceeding of the 2013 IEEE Conference on Computer Vision and Pattern Recognition,Piscataway:IEEE Press,2013:415-422)检测的准确率提高了6%,并且误报率降低了4.5%。在实际的应用中,能够获得更好的前景背景分离效果,为视频分析等方面的研究奠定更好的基础。 展开更多
关键词 运动目标检测 视频图像 深度自编码网络 在线学习 代价函数敏感
下载PDF
基于CS-RF模型的微额信贷风险预测 被引量:1
7
作者 赵迎 何华 吴超 《时代金融》 2019年第8期174-177,共4页
在金融市场中,互联网征信是规避损失风险的重要参考依据,其中违约用户识别率的准确性对征信来说则更为重要。从这一角度出发,本文提出了改进的随机森林算法(CS-RF)。利用金融公司的实际数据,从随机森林原模型基础上加以改进,在训练样本... 在金融市场中,互联网征信是规避损失风险的重要参考依据,其中违约用户识别率的准确性对征信来说则更为重要。从这一角度出发,本文提出了改进的随机森林算法(CS-RF)。利用金融公司的实际数据,从随机森林原模型基础上加以改进,在训练样本生成决策树后引入代价敏感函数,为多类样本和少类样本的错误分类赋予不同的代价,搜索出更优的决策树集成。通过实证分析,将预测结果与Logistic回归模型,决策树,传统随机森林,BP神经网络进行对比,得出CS-RF模型预测效果最优。 展开更多
关键词 互联网征信 随机森林 非平衡样本 代价敏感函数
下载PDF
参数优选残差网络下的井震联合反演方法
8
作者 郑杰 文畅 +1 位作者 谢凯 盛冠群 《电子测量技术》 北大核心 2022年第12期168-174,共7页
声波测井资料在层位标定和储层反演等工作中发挥着重要作用。然而受仪器设备、地质环境等条件的限制,实际得到的声波测井曲线常有失真现象。为了向油气藏勘探提供可靠的数据支持,提高储层预测的准确性,提出一种参数优选残差网络下的井... 声波测井资料在层位标定和储层反演等工作中发挥着重要作用。然而受仪器设备、地质环境等条件的限制,实际得到的声波测井曲线常有失真现象。为了向油气藏勘探提供可靠的数据支持,提高储层预测的准确性,提出一种参数优选残差网络下的井震联合反演方法,对失真的声波测井曲线予以重构。考虑到传统人工神经网络无法表达出井震间的强非线性关系,该方法以深度学习中的残差网络(ResNet)构建智能反演模型,通过网络设计、参数选择以及模型训练,找到井震间更好的映射表达。同时综合考虑测井曲线的特点与均方损失的不足,设计了一种代价敏感损失函数Fusion,进一步提高模型整体的反演精度。在真实地震数据和测井资料上展开实验,并与全连接神经网络(FCNN)和多元回归分析(MLR)的反演结果对比分析,表明所提方法反演的声波测井曲线精度更高,相关系数达到0.912,均方根误差减小到13.399。将所提Fusion损失用于反演声波测井曲线,相关系数增加了2.5%,均方根误差减小了17.4%。 展开更多
关键词 井震联合反演 声波测井资料 代价敏感损失函数 残差网络 智能反演模型
下载PDF
类别不平衡高维数据的最优逻辑斯蒂回归
9
作者 李智凡 尹建鑫 《系统科学与数学》 CSCD 北大核心 2023年第9期2341-2363,共23页
研究响应变量两类比例不平衡时逻辑斯蒂回归的最优参数估计和代价敏感分类问题.在代价敏感的损失函数下,将不平衡的两类数量之比作为参数,通过等价转换成一个重新加权的类别平衡分类问题,得到了原问题预测的超额风险(excess risk)的上... 研究响应变量两类比例不平衡时逻辑斯蒂回归的最优参数估计和代价敏感分类问题.在代价敏感的损失函数下,将不平衡的两类数量之比作为参数,通过等价转换成一个重新加权的类别平衡分类问题,得到了原问题预测的超额风险(excess risk)的上界和逻辑斯蒂回归系数误差上界.同时利用VC维技术得到了正则条件下超额风险的minimax下界.得出结论:在相差一个可忽略常数倍的意义下,非平衡数据在代价敏感损失下得到的惩罚似然估计的误差界可以达到最优,且最优误差与一个可收敛至零的稀有类比例有关.其次,论文还将主要结论推广至损失函数为非凸的情形,并讨论了在两类数量比例需要估计时的误差上界.此外,通过数值模拟比较了给定和待估计类别比例的实际表现,发现主要结论不受影响. 展开更多
关键词 代价敏感损失函数 类别不平衡数据 逻辑斯蒂回归 minimax最优
原文传递
密集卷积神经网络和辅助特征相结合的乳腺组织病理图像有丝分裂检测方法 被引量:1
10
作者 段慧芳 刘娟 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2019年第5期434-440,共7页
显微镜下特定大小视野范围内的平均有丝分裂个数是乳腺癌分级的一个重要指标。传统的人工检测方法耗时费力,结果受病理医生主观因素影响大,容易出错。本文提出将密集卷积神经网络(DenseNet)与辅助特征相结合,构建预测模型,以实现有丝分... 显微镜下特定大小视野范围内的平均有丝分裂个数是乳腺癌分级的一个重要指标。传统的人工检测方法耗时费力,结果受病理医生主观因素影响大,容易出错。本文提出将密集卷积神经网络(DenseNet)与辅助特征相结合,构建预测模型,以实现有丝分裂的自动检测。本文方法针对训练过程中正负样本严重不均衡问题,使用代价敏感损失函数缓解该问题。利用本文方法与其他算法对乳腺组织病理图像有丝分裂进行检测,实验结果表明,本文方法在独立测试集上的F分数为0. 801 9,高于其他方法,验证了其有效性。 展开更多
关键词 乳腺癌分级 有丝分裂检测 密集卷积神经网络 代价敏感损失函数
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部