基于采样技术的主动不平衡学习算法研究被引量：2

Study of active learning algorithms on imbalanced data based on sampling technique

下载PDF

导出

摘要针对在不平衡分布数据中执行主动学习,其分类面容易形成偏倚,从而导致主动学习失效这一问题,拟采用采样技术作为学习过程的平衡控制策略,在调查了几种已有的采样算法的基础上,提出了一种边界过采样算法,并将其与主动学习相结合。此外,考虑到极限学习机所具有的泛化能力强、训练速度快等优点,拟采用其作为基分类器,来加速主动学习的进程。通过12个基准数据集对加入平衡控制策略的主动学习算法的性能进行了验证,结果表明:在不平衡场景下,主动学习确实会受到其负面影响,且引入了采样技术的主动学习算法性能明显更优。 To solve the problem that the classification hyperplane tends to be biased towards majority class during conducting active learning in the class imbalanced data, further makes active learning lose efficacy, instance sampling technique is considered as balance control strategy of active learning. First,the characteristics of various sampling algorithms are investigated. Then, a novel boundary oversampling algorithm is proposed. They are considered to be used as balance control strategies for active learning. In addition, we try to implement active learning by using Extreme Learning Machine(ELM) as basic classifier according to two reasons as follows: it has strong generalization ability and it has a faster training speed. The experiments were conducted on 12 benchmark data sets, indicating the effectiveness and feasibility of the proposed improved active learning algorithm. Also, the experimental results show that the active learning can be indeed negatively affected by skewed data distribution, as well the active learning algorithms with instance sampling can produce better performance.

作者李青雯孙丹于化龙

机构地区江苏科技大学计算机科学与工程学院东南大学自动化学院

出处《电子设计工程》 2018年第1期7-12,19,共7页 Electronic Design Engineering

基金国家自然科学基金(61305058) 江苏省自然科学基金(BK20130471) 中国博士后科学基金(2013M540404)

关键词类别不平衡主动学习极限学习机样本采样边界过采样 class imbalance active learning extreme learning machine instance sampling boundary over-sampling

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献24

1卓嘎,德庆卓嘎,陈涛.拉萨市大气污染分布特征及气象影响因子分析[J].中国环境监测,2009,25(1):90-97. 被引量：20
2格央,罗布坚赞,次仁措姆.西藏地区2010年2月中旬大范围大风天气成因分析[J].西藏科技,2010(9):57-58. 被引量：4
3白永飞,吕学斌,平措,张成,布多.2014—2016年拉萨市大气环境质量分析及评价[J].气象科技,2018,46(6):1274-1279. 被引量：10
4姚仲敏,潘飞,沈玉会,吴金秋,于晓红.基于GA-BP和POS-BP神经网络的光伏电站出力短期预测[J].电力系统保护与控制,2015,43(20):83-89. 被引量：71
5赵剑波,王星星,张兴发.西藏拉萨市(1980～2012年)气温变化特征及其环境意义[J].西藏大学学报（社会科学版）,2015,30(5):33-39. 被引量：3
6王昕,黄柯,郑益慧,李立学,郎永波,吴昊.基于PNN/PCA/SS-SVR的光伏发电功率短期预测方法[J].电力系统自动化,2016,40(17):156-162. 被引量：49
7许童羽,马艺铭,曹英丽,唐瑞,陈俊杰.基于主成分分析和遗传优化BP神经网络的光伏输出功率短期预测[J].电力系统保护与控制,2016,44(22):90-95. 被引量：42
8王昕,黄柯,郑益慧,李立学,邵凤鹏,贾立凯,徐清山.基于萤火虫算法?广义回归神经网络的光伏发电功率组合预测[J].电网技术,2017,41(2):455-461. 被引量：34
9邓呈格,钟志峰.人工智能算法在光伏发电量预测中的应用[J].物联网技术,2017,7(4):68-69. 被引量：7
10刘爱国,黄泽平,薛云涛,汪硕承.基于遗传算法小波神经网络的光伏微网发电预测[J].电测与仪表,2017,54(7):28-33. 被引量：16

引证文献2

1杨少华,李艾玲,雍浩,何瑛,孙堃.基于变量选择和DE-GWO算法的光伏发电功率预测[J].智慧电力,2018,46(12):38-44. 被引量：7
2孙源龙,赵文娜,汪梓彤,卓嘎.拉萨市空气质量时间分布特征分析与基于极限学习机的预测[J].皮革制作与环保科技,2021,2(23):150-153. 被引量：1

二级引证文献8

1张俊,贺旭,陆春良,王波.基于数值天气预报的光伏功率短期预测分类组合算法[J].广东电力,2019,32(6):55-60. 被引量：13
2张静,褚晓红,黄学安,范文,陈雁,万泉,赵加奎.一种基于加权马尔科夫链修正的SVM光伏出力预测模型[J].电力系统保护与控制,2019,47(19):63-68. 被引量：21
3赵成斌,林湘宁,汪致洵,随权,李正天.计及岛群辐射半径与能量波动性的远洋海岛群分割组合多目标优化策略[J].智慧电力,2020,48(6):85-91. 被引量：6
4安鹏跃,孙堃.基于相似日和回声状态网络的光伏发电功率预测[J].智慧电力,2020,48(8):38-43. 被引量：14
5彭曙蓉,郑国栋,黄士峻,李彬,胡泽斌.基于XGBoost算法融合多特征短期光伏发电量预测[J].电测与仪表,2020,57(24):76-83. 被引量：28
6廖志伟,肖异瑶,张文锦.基于改进灰狼算法的变电站多阶段升压规划优化方法[J].智慧电力,2021,49(7):93-101. 被引量：8
7许洋,顾海航.基于遗传算法优化的ELM的空气质量预测研究[J].计算机时代,2022(9):73-77. 被引量：2
8陈海宏,易永利,黄珅,韩静怡.基于CatBoost算法的短期光伏功率预测方法[J].浙江电力,2023,42(2):67-75. 被引量：5

1秦孟梅,邱建林,陆鹏程,陈璐璐,赵伟康.基于AdaBoost的类不平衡学习算法[J].计算机应用研究,2017,34(11):3229-3232. 被引量：11
2马子骥,彭强,周冰航,李元良,唐涛.基于分数时延信道模型的低复杂度信道估计方法[J].重庆邮电大学学报（自然科学版）,2017,29(5):611-617. 被引量：2
3何继玲,于威威.基于M3和POSS特征的网络流量分类研究[J].计算机技术与发展,2018,28(1):83-88. 被引量：2
4苏其昌,张汉庆,王晓慧.经皮球囊扩张椎体后凸成形术与保守治疗骨质疏松性椎体压缩性骨折的Meta分析[J].江汉大学学报（自然科学版）,2018,46(1):77-82. 被引量：10
5燕昺昊,韩国栋,黄雅静,王孝龙.非平衡网络流量识别方法[J].计算机应用,2018,38(1):20-25. 被引量：8
6胡峰,周耀,王蕾.基于邻域粗糙集的主动学习方法[J].重庆邮电大学学报（自然科学版）,2017,29(6):776-784. 被引量：3
7王柯翔,黎琳,彭双和.一种基于LWE采样算法的实现与优化[J].北京交通大学学报,2017,41(5):32-36.
8李然,林政,林海伦,王伟平,孟丹.文本情绪分析综述[J].计算机研究与发展,2018,55(1):30-52. 被引量：103
9杨浩昌,李廉水,刘军.产业聚集与中国城市全要素生产率[J].科研管理,2018,39(1):83-94. 被引量：70
10杜璞,张小艳.激光点云运动人体目标识别及运动信息提取[J].激光杂志,2018,39(1):150-153. 被引量：4

电子设计工程

2018年第1期

浏览历史

内容加载中请稍等...

基于采样技术的主动不平衡学习算法研究被引量：2

同被引文献24

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于采样技术的主动不平衡学习算法研究 被引量：2

同被引文献24

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于采样技术的主动不平衡学习算法研究被引量：2