一种面向管道堵塞不均衡样本集的主动学习方法被引量：2

An Active Learning Method for Unbalanced Sample Set of Pipeline Blockage

下载PDF

导出

摘要针对城市排水管道堵塞检测识别过程中有标签的样本数量较少,人工标注管道数据样本成本高昂,以及管道堵塞数据集中存在明显的类别不均衡问题,提出基于主动学习的方法以解决上述问题。同时,将极限随机树作为基分类器,对未标注样本集进行分类识别;样本查询策略选择将分类熵和余弦相似度相结合的样本采样策略。该方法使得模型在主动学习的过程中能够提高对少数类样本的关注度。试验结果在两个不同不均衡程度的数据集上进行验证,结果表明:笔者提出的主动学习模型在两个试验数据集上对少数类的分类识别效果都取得了较高的F1度量值,模型的分类稳定性并没有受到数据不均衡程度变化的干扰。 In view of the low number of labeled samples in the process of pipeline blockage detection and identification of urban drainage system,the high cost of manual marking pipeline data samples and obvious imbalance of categories exist in the data set of pipeline blockage,a method based on active learning to solve above-mentioned problems was proposed.At the same time,the limit random tree was used as the base classifier to classify and identify unlabeled samples.The sampling selection strategy combines the classification entropy and cosine similarity sampling strategy so that the attention of minority samples can be improved in process of active learning.The experimental results verified on two data sets with different degrees of imbalance showed that,the proposed active learning model achieves a high F1-value on the two experimental data sets,and the classification stability of the model is not disturbed by the imbalance degree of the data.

作者王显龙冯早赵燕锋 WANG Xian-long;FENG Zao;ZHAO Yan-feng(Faculty of Information Engineering&Automation;Yunnan Key Laboratory of Artificial Intelligence,Kunming University of Science and Technology)

机构地区昆明理工大学信息工程与自动化学院昆明理工大学云南省人工智能重点实验室

出处《化工自动化及仪表》 CAS 2021年第3期222-231,共10页 Control and Instruments in Chemical Industry

基金国家自然科学基金项目(61563024,51765022)。

关键词管道堵塞数据不均衡主动学习分类熵余弦相似度极限随机树 pipeline blockage imbalanced datasets active learning classifier entropy cosine similarity limit random tree

分类号 TU991.36 [建筑科学—市政工程]

引文网络
相关文献

参考文献17

1闫菁,冯早,吴建德,马军.LMD特征融合与SVM的供水管道堵塞识别[J].传感器与微系统,2017,36(7):57-61. 被引量：5
2马艳.城市排水管道堵塞的原因与防治措施[J].四川水泥,2016(7):330-330. 被引量：3
3朱雪峰,冯早,黄国勇,李洋.基于声学特征的埋地管道堵塞故障的聚类识别方法[J].云南大学学报（自然科学版）,2018,40(4):665-675. 被引量：5
4焦敬品,李勇强,吴斌,何存富.基于BP神经网络的管道泄漏声信号识别方法研究[J].仪器仪表学报,2016,37(11):2588-2596. 被引量：66
5伍林峰,冯早,黄国勇,李洋.小波包增强稀疏表征分类的管道堵塞故障识别[J].电子测量与仪器学报,2019,31(3):35-43. 被引量：5
6郎宪明,李平,曹江涛,芦思宇,李俨,任泓.基于非平衡数据处理的管道泄漏检测与定位研究[J].湖南大学学报（自然科学版）,2018,45(2):110-118. 被引量：9
7杨文柱,田潇潇,王思乐,张锡忠.主动学习算法研究进展[J].河北大学学报（自然科学版）,2017,37(2):216-224. 被引量：11
8陈念,唐振民.QBC主动采样学习在垃圾邮件在线过滤中的应用[J].计算机工程与应用,2014,50(22):170-174. 被引量：3
9毛蔚轩,蔡忠闽,童力.一种基于主动学习的恶意代码检测方法[J].软件学报,2017,28(2):384-397. 被引量：27
10伍林峰,冯早,朱雪峰.基于多尺度模糊熵和稀疏表征分类的管道多重堵塞状态识别[J].化工自动化及仪表,2020,47(1):43-50. 被引量：1

二级参考文献158

1龙军,殷建平,祝恩,赵文涛.主动学习研究综述[J].计算机研究与发展,2008,45(z1):300-304. 被引量：31
2朱启兵,杨宝,黄敏.基于核映射稀疏表示分类的轴承故障诊断[J].振动与冲击,2013,32(11):30-34. 被引量：9
3王灿,王嘉乐,会强,马红月.Hilbert-Huang变换在机车滚动轴承故障诊断中的应用[J].振动．测试与诊断,2013,33(S1):184-187. 被引量：8
4徐洁,丁金婷,江皓.管道泄漏检测方法综述[J].管道技术与设备,2004(4):14-16. 被引量：17
5王继华,彭振斌,关镶锋.供水管网检漏技术现状及发展趋势[J].桂林工学院学报,2004,24(4):456-460. 被引量：19
6臧春喜,郭彦懿,白春华,吴建星.基于LabVIEW的次声波测试系统[J].仪表技术,2005(1):18-19. 被引量：4
7焦敬品,何存富,吴斌,费仁元.基于模态分析和小波变换的声发射源定位新算法研究[J].仪器仪表学报,2005,26(5):482-485. 被引量：28
8谷小红,张光新,侯迪波,周泽魁.小波包分解与能量特征提取相结合的水管泄漏位置的确定[J].四川大学学报（工程科学版）,2005,37(6):145-149. 被引量：9
9胡国胜,钱玲,张国红.支持向量机的多分类算法[J].系统工程与电子技术,2006,28(1):127-132. 被引量：33
10刘恩斌,李长俊,彭善碧,张红兵.基于压力波法的管道堵塞检测技术[J].天然气工业,2006,26(4):112-114. 被引量：11

共引文献271

1黄新敬,燕育培,裴连军,高潮,封皓.基于最短路径规划的供热管网泄漏定位方法[J].仪器仪表学报,2023,44(8):164-172.
2燕宗伟,李平,郎宪明,刘浩宇.基于遗传算法优化BP神经网络的管道泄漏检测方法研究[J].当代化工,2020,49(1):216-220. 被引量：18
3刘振宇,李钦富,杨硕,邓应强,刘芬,赖新明,白雪珂.一种基于主动学习和多种监督学习的情感分析模型[J].中国电子科学研究院学报,2020,15(2):171-176. 被引量：2
4李恬,冯早,朱雪峰.基于主动学习和最优路径森林的管道故障分类识别方法[J].电子测量与仪器学报,2022,36(12):67-76. 被引量：1
5徐建良,姜亦宏,张巍,王秋红.一种基于Co-Training的海洋文献分类方法[J].中国海洋大学学报（自然科学版）,2010,40(2):105-110. 被引量：1
6刘君,熊忠阳,王银辉.图像多分类主动学习方法[J].计算机工程与应用,2010,46(13):11-14. 被引量：2
7汪婵,程玉虎,王雪松.基于局部稀疏K近邻密度的主动学习[J].中国科技论文在线,2011,6(7):507-511. 被引量：1
8章林柯,崔立林.潜艇机械噪声源分类识别的小样本研究思想及相关算法评述[J].船舶力学,2011,15(8):940-947. 被引量：5
9熊伟,周水庚,关佶红.网络数据分类研究进展[J].模式识别与人工智能,2011,24(4):527-537. 被引量：3
10夏代雄.凤滩水电厂高压充油电缆的运行维护[J].湖南电力,2000,20(1):25-26.

同被引文献31

1田睿,孟海东,陈世江,王创业,张飞.基于深度神经网络的岩爆烈度分级预测[J].煤炭学报,2020(S01):191-201. 被引量：46
2刘凤芹.基于链式方程的收入变量缺失值的多重插补[J].统计研究,2009,26(1):71-77. 被引量：6
3王果,樊洪海,刘刚,公培斌,李勇,石春林.控制压力钻井技术应用研究[J].石油钻探技术,2009,37(1):34-38. 被引量：61
4王元汉,李卧东,李启光,徐钺,谭国焕.岩爆预测的模糊数学综合评判方法[J].岩石力学与工程学报,1998,17(5):493-501. 被引量：319
5马庆春,张来斌,樊建春.基于状态监测的井喷风险动态安全评价[J].安全与环境学报,2009,9(6):176-179. 被引量：3
6梅大成,郑巧,何志敏,张振峰.油气井钻井过程中井喷预测机理研究[J].天然气工业,2010,30(1):68-70. 被引量：16
7潘登,魏强,肖润德,杨玻,祝秀娟.欠平衡钻井溢流风险分析方法[J].天然气工业,2011,31(5):73-76. 被引量：3
8陶新民,童智靖,刘玉,付丹丹.基于ODR和BSMOTE结合的不均衡数据SVM分类算法[J].控制与决策,2011,26(10):1535-1541. 被引量：22
9王俊霞,张玉,鄢哲明,李雨丹.基于组合赋权方法的农村公共产品供给绩效评价研究[J].西北大学学报（哲学社会科学版）,2013,43(2):117-121. 被引量：15
10孙合辉,陶青龙,李邓玥,陈玉新,高敬民,姜勇.基于录井参数的溢流预警模型研究[J].录井工程,2015,26(4):17-21. 被引量：7

引证文献2

1温廷新,苏焕博.基于MICE_RF的组合赋权—极限随机树岩爆预测模型[J].黄金科学技术,2022,30(3):392-403.
2张禾,池紫欣.基于BSMOTE-SVM算法的溢流风险评价[J].控制工程,2023,30(12):2173-2178.

1段敏霞,刘鑫,董增寿.深度自编码与改进损失函数在极端不均衡故障诊断中的应用[J].科学技术与工程,2021,21(11):4432-4438. 被引量：5
2刘克颜.基于机器视觉的运输机溜槽堵塞检测系统[J].煤炭加工与综合利用,2021(2):21-22. 被引量：1
3李明岩,张帆,李丹.宝钢湛江装煤车的自动化[J].现代制造技术与装备,2021,57(2):187-188. 被引量：3
4张书林.工业搬运三轴机械手的制作探究[J].机械管理开发,2021,36(4):10-11. 被引量：1
5白德灵.音乐类非遗通过虚拟仿真实验平台数字化传承的可行性探究[J].戏剧之家,2021(16):64-66. 被引量：4
6张维,刘禾,杨国田,马亮.新型清焦装置在炉膛火焰红外温度检测系统的应用研究[J].热力发电,2021,50(4):84-91. 被引量：2
7余盛达,叶保璇,冯毅强,易婷婷,韩旭君,施超.基于前端识别的架空输电线路在线监测技术研究[J].通信电源技术,2021,38(3):44-46. 被引量：2
8吴晓成,梁丹,梁冬泰,李平.基于YOLO深度学习模型的铝型材表面缺陷识别方法[J].机械设计与研究,2021,37(2):34-39. 被引量：10
9苏焕程,程亦涵,张君,王昀,张倩.一种基于TOA的同型雷达同源判别方法[J].航天电子对抗,2021,37(2):11-14. 被引量：2
10朱雪峰,冯早,吴建德,马军.基于信息增益的管道堵塞声学检测方法[J].振动．测试与诊断,2021,41(2):267-274. 被引量：5

化工自动化及仪表

2021年第3期

浏览历史

内容加载中请稍等...

一种面向管道堵塞不均衡样本集的主动学习方法被引量：2

参考文献17

二级参考文献158

共引文献271

同被引文献31

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种面向管道堵塞不均衡样本集的主动学习方法 被引量：2

参考文献17

二级参考文献158

共引文献271

同被引文献31

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种面向管道堵塞不均衡样本集的主动学习方法被引量：2