基于边缘增长的协同训练方法

Co-training method based on margin sample addition

下载PDF

导出

摘要为保证分类器间的差异性,同时提高子分类器自身性能,提出一种新的基于边缘样本增长的半监督集成学习方法——边缘协同森林（M-Co-Forest）。当从未标记样本中选取伪标记样本时,不仅考虑未标记样本的标记置信度,同时考虑未标记样本在已标记样本中的位置。只有处于当前分类器训练样本边缘且置信度高于预设阈值的样本才能被赋予伪标签,加入下一轮学习。同时,利用噪音学习理论指导训练过程,当伪标记样本的数量不足以进一步提升分类器性能时,停止迭代。多个UCI数据集和CTG数据上的实验结果表明M-Co-Forest的性能优于对比算法。 In order to ensure the disagreements among sub-classifiers and improve the classifier performance,a new semi-supervised ensemble learning method based on margin samples addition,termed M-Co-Forest,is proposed in this paper.When pseudo-labeled samples are selected from unlabeled samples,both the unlabeled samples＇ labeling confidence level and the position of unlabeled samples in the labeled samples are considered.Only samples located at the margin of the current classifier and the labeling confidence level above the preset threshold can be labeled and join the next round of training.At the same time,the noise learning theory is introduced to guide the training process.When pseudo-labeled samples size is not enough to further improve the classifier performance,the iteration stops.The experimental results on multiple UCI datasets and CTG data show that M-Co-Forest outperforms the comparison algorithms.

作者刘紫阳高占宝李绪隆 Liu Ziyang;Gao Zhanbao;Li Xulong(School of Automation Science and Electrical Engineering, Beihang University, Beijing 100191, China)

机构地区北京航空航天大学自动化科学与电气工程学院

出处《仪器仪表学报》 EI CAS CSCD 北大核心 2018年第3期45-53,共9页 Chinese Journal of Scientific Instrument

关键词半监督学习协同训练集成学习边缘样本 semi-supervised learning Co-training ensemble learning margin sample

分类号 TP391 [自动化与计算机技术—计算机应用技术] TH702 [机械工程—精密仪器及机械]

引文网络
相关文献

参考文献10

1刘建伟,刘媛,罗雄麟.半监督学习方法[J].计算机学报,2015,38(8):1592-1617. 被引量：132
2高桂荣,严威,夏晨阳,吴国宝.结合空间信息的PTSVM的遥感图像变化检测[J].电子测量技术,2016,39(4):45-48. 被引量：6
3王通,段泽文,李琨.基于改进AdaBoost的油井动液面自适应集成建模[J].电子测量与仪器学报,2017,31(8):1342-1348. 被引量：8
4周志华.基于分歧的半监督学习[J].自动化学报,2013,39(11):1871-1878. 被引量：87
5于墨,赵铁军,胡鹏龙,郑德权.结构化学习的噪声可学习性分析及其应用[J].软件学报,2013,24(10):2340-2353. 被引量：2
6田再克,李洪儒,孙健,李宝晨.基于改进MF-DFA和SSM-FCM的液压泵退化状态识别方法[J].仪器仪表学报,2016,37(8):1851-1860. 被引量：11
7陈自岩,黄宇,王洋,傅兴玉,付琨.一种非监督的事件触发词检测和分类方法[J].国外电子测量技术,2016,35(7):91-95. 被引量：7
8陈超,沈飞,严如强.改进LSSVM迁移学习方法的轴承故障诊断[J].仪器仪表学报,2017,38(1):33-40. 被引量：77
9Emrah Ergul.Relative attribute based incremental learning for image recognition[J].CAAI Transactions on Intelligence Technology,2017,2(1):1-11. 被引量：3
10钱彬,唐振民,沈肖波,郭剑辉,吕建勇.基于多特征流形学习和矩阵分解的路面裂缝检测[J].仪器仪表学报,2016,37(7):1639-1646. 被引量：14

二级参考文献172

1骆亚波,郑勇,夏治国,苏牡丹.大射电望远镜馈源系统50m模型外界激励响应的检测及分析[J].仪器仪表学报,2007,28(S1):369-373. 被引量：3
2杨剑,王珏,钟宁.流形上的Laplacian半监督回归[J].计算机研究与发展,2007,44(7):1121-1127. 被引量：15
3Angluin D, Laird PD. Learning from noisy examples. Machine Learning, 1988,2(4):343-370.[doi: 10.1023/A:I022873112823].
4Laird PD. Learning from Good and Bad Data. Boston: Kluwer Academic Publishers, 1988.
5Kschischang FR, Frey BJ, Loeliger H. Factor graphs and the sum-product algorithm. IEEE Trans. on Information Theory, 2001, 47(2):498-519.[doi: 10.1109118.910572].
6Yarowsky D, Ngai G. Inducing multilingual POS taggers and NP bracketers via robust projection across aligned corpora. In: Proc. of the NAACL. 200 I. 200-207. http://dl.acm.org/citation.cfm?doid=I072133.1072187.
7Blum A, Mitchell T. Combining labeled and unlabeled data with co-training. In: Proc. of the Workshop on Computational Learning Theory (COLT). 1998.[doi: 10.11451279943.279962].
8Kearns M. Efficient noise-tal erant learning from statistical queries. Journal of the ACM (JACM), 1998,45(6):983-1006. http://dl.acm.org/citation.cfm?id=2933 5 1.
9Blum A, Frieze A, Kannan R, Vempala S. A polynomial-time algorithm for learning noisy linear threshold functions. In: Proc. of the 37th Annual IEEE Symp. on Foundations of Computer Science. Burlington, 1996.330-338.[doi: 10.1 I 09/SFCS.l 996.548492].
10Cohen E. Learning noisy perceptrons by a perceptron in polynomial time. In: Proc. of the 38th Annual Symp. on Foundations of Computer Science. Miami Beach, 1997. 514-523.[doi: 10.1109/SFCS.1997.646140].

共引文献322

1李兵,韩睿,何怡刚,张晓艺,侯金波.改进随机森林算法在电机轴承故障诊断中的应用[J].中国电机工程学报,2020,40(4):1310-1319. 被引量：78
2胡云青,邱清盈,余秀,武建伟.基于改进三体训练法的半监督专利文本分类方法[J].浙江大学学报（工学版）,2020,54(2):331-339. 被引量：9
3宋志坤,徐立成,胡晓依,任海星,李强.基于改进型shapelets算法的动车组轴箱轴承故障诊断方法研究[J].仪器仪表学报,2021,42(2):66-74. 被引量：9
4李辉,郝如江.基于循环多核相关熵的故障检测方法及应用[J].仪器仪表学报,2020,41(5):252-260. 被引量：9
5Fei Shen,Chao Chen,Jiawen Xu,Ruqiang Yan.A Fast Multi-tasking Solution: NMF-Theoretic Co-clustering for Gear Fault Diagnosis under Variable Working Conditions[J].Chinese Journal of Mechanical Engineering,2020,33(1):182-196. 被引量：6
6麻瓯勃,刘雪娇,唐旭栋,周宇轩,胡亦承.基于半监督学习的恶意URL检测方法[J].计算机系统应用,2020(11):11-20. 被引量：4
7杨青,薛辉.基于领域自适应的故障诊断研究与进展[J].沈阳理工大学学报,2020(4):82-86. 被引量：2
8刘栋,张彩环.情境特征及其在情感分类模型中的应用[J].计算机应用研究,2020,37(1):144-147.
9肖彭昊,杨修伟,范媛媛.基于VGGNet-plus的路面裂痕自动分类识别方法[J].电子器件,2022,45(2):490-493.
10王通,陈延彬.基于改进生成对抗网络的动液面建模数据扩充[J].电子测量与仪器学报,2023,37(2):99-109.

1闫丹,江敏瑜,王云红,张琳,张传辉,杨荣平.积雪草总苷脂质体的制备及体外透皮研究[J].中草药,2018,49(9):2041-2048. 被引量：18
2梁明波.分析机动车检测技术的发展[J].建材与装饰,2018,14(22):212-213. 被引量：1
3李灵芝,李百寿,沈宇臻,许锐.一种基于SVM的无人机影像中单个建筑物的角点检测方法[J].测绘通报,2017(10):52-57. 被引量：2
4姬雪可,郑江霞,杨璐,郑丽敏.基于电子鼻和随机子空间集成学习方法判别鸡蛋贮藏时间[J].中国家禽,2018,40(8):39-42. 被引量：3
5王晓霞,蒋伏松,王宇,熊贇.基于ICD-10诊断编码的慢性病并发症聚类算法[J].大数据,2018,4(3):37-45. 被引量：2
6刘利群,项顺伯,王晗.基于小波变换和极限旋转森林算法的入侵检测模型[J].南京邮电大学学报（自然科学版）,2018,38(3):77-82. 被引量：1
7崔颖,徐凯,陆忠军,刘述彬,王立国.主动学习策略融合算法在高光谱图像分类中的应用[J].通信学报,2018,39(4):91-99. 被引量：7
8姚巍.预制T梁混凝土浇筑工艺质量控制关键措施[J].中小企业管理与科技,2018,2(12):177-178. 被引量：1
9毕凌锌,杨立娜.基于双目立体视觉的运动目标探测[J].科技创新与应用,2018,8(17):14-15. 被引量：4
10许晓路,周东国,刘正阳,聂德鑫,徐进霞,蔡炜,郭艳雪.一种基于PCNN的电力设备故障区域提取方法[J].电子技术应用,2018,44(2):97-101. 被引量：2

仪器仪表学报

2018年第3期

浏览历史

内容加载中请稍等...

基于边缘增长的协同训练方法

参考文献10

二级参考文献172

共引文献322

相关作者

相关机构

相关主题

浏览历史