噪声可容忍的标记组合半监督学习算法被引量：1

Noise Tolerant Label Combination Semi-supervised Learning Algorithm

下载PDF

导出

摘要针对传统机器学习方法在完成分类任务时多数存在人工标记成本较高、泛化能力较弱的问题,提出一种标记组合半监督学习算法。基于集成学习的思想,利用有标记数据训练多个弱模型并进行组合,增强模型的泛化能力。对无标记数据进行预测,生成有噪声的标记并组合建模。在风险最小化的框架下,使模型收敛达到最优。实验结果表明,在2种有监督场景下与现有的支持向量机、分类与回归树、神经网络等算法相比,该算法具有较优的泛化能力。 Traditional machine learning method always needs high cost manual marking process,and exhibits weak ability of generalization in classification task.In order to solve these problems,a label combination semi-supervised learning algorithm is proposed.Taking advantage of the principle of ensemble learning,the algorithm uses the labeled data to train multiple weak learners,and combine them to enhance the generalization ability.Predict the unlabeled data to generate noise labels,and then combine and model these noise labels to make the model more robust.Under the framework of risk minimization,the model converges to the optimal state.Experimental results show that,compared with some existing learning algorithms like Support Vector Machine(SVM),Classification and Regression Tree(CART),Neural Network(NN),the algorithm has relatively good generalization ability.

作者林金钏艾浩军 LIN Jinchuan;AI Haojun(School of Computer Science,Wuhan University,Wuhan 430072,China)

机构地区武汉大学计算机学院

出处《计算机工程》 CAS CSCD 北大核心 2019年第4期157-162,168,共7页 Computer Engineering

基金国家重点研发计划(2016YFB0502201)

关键词半监督学习集成学习风险最小化梯度下降损失函数 semi-supervised learning ensemble learning risk minimization gradient descent loss function

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1刘康,钱旭,王自强.主动学习算法综述[J].计算机工程与应用,2012,48(34):1-4. 被引量：25

二级参考文献22

1Hastie T,Tibshirani R, Friedman J.The elements of sta- tistical learning: data mining, inference, and prediction, ser.statistics[M].2nd ed.New York:Springer,2009.
2Boser B E, Guyon I M, Vapnik V N.A training algo- rithm for optimal margin classifiers[C]//Proceedings of the Fifth Annual ACM Workshop on Computational Learning Theory, 1992 : 144-152.
3Haykin S.Neural networks and learning machines[M]. 3rd ed.Cambridge, MA: Prentice-Hall, 2008.
4Settles B.Active learning literature survey[R].Univ of Wisconsin-Madison, 2011.
5Tuia D, Ratle F, Pacifici F, et al.Active learning meth- ods for remote sensing image classification[J].IEEE Trans on Geosci Remote Sens,2009,47(7):2218-2232.
6Copa L,'Tuia D, Volpi M, et al.Unbiased query-by-bagging active learning for VHR image classification[C]//Proc SPIE Remote Sens Conf,2010.
7Di W, Crawford M.Multi-view adaptive disagreement based active learning for hyperspectral image classification[C]// IEEE International Geoscience and Remote Sensing Symposium, 2010 : 1374-1377.
8Muslea I.Active learning with multiple views[J].Journal of Artificial Intelligence Research,2006,27:203-233.
9Campbell C, Cristianini N, Smola A J.Query leaming with large margin classifiers[C]//Proc Int Conf Mach Leam(ICML), 2000: 111-118.
10Schohn G, Cohn D.Less is more: Active learning with support vector machines[C]//Proc 17th ICML, 2000: 839-846.

共引文献24

1刘振宇,李钦富,杨硕,邓应强,刘芬,赖新明,白雪珂.一种基于主动学习和多种监督学习的情感分析模型[J].中国电子科学研究院学报,2020,15(2):171-176. 被引量：2
2邵忻.基于跨领域主动学习的图像分类方法[J].计算机应用,2014,34(4):1169-1171. 被引量：6
3张静,聂章龙.基于主动学习的动态模糊聚类算法[J].计算机与现代化,2014(5):24-27.
4张雁,吕丹桔,王红崧.基于主动学习的环境音分类研究[J].计算机技术与发展,2014,24(6):110-113.
5梁喜涛,顾磊.基于分层选择策略的主动学习分词方法[J].计算机应用研究,2015,32(5):1353-1356.
6李艳玲,颜永红.中文口语理解弱监督训练方法[J].计算机应用,2015,35(7):1965-1968. 被引量：2
7梁喜涛,顾磊.基于最近邻的主动学习分词方法[J].计算机科学,2015,42(6):228-232. 被引量：1
8高学伟,郑世珏,高丽,李松丽.基于SVM主动学习的微信监测研究[J].计算机与数字工程,2016,44(4):715-719.
9朱丽,陆建峰.基于主动学习的微博聚类分析[J].数据采集与处理,2016,31(3):599-605. 被引量：1
10任红格,李冬梅,李福进.动态神经网络分类器主动学习算法及其智能控制应用[J].计算机应用与软件,2016,33(7):247-251. 被引量：2

同被引文献3

1古楠楠,樊明宇,王迪,贾立好,杜亮.基于仿射子空间稀疏表示的半监督分类[J].中国科学：信息科学,2015,45(8):985-1000. 被引量：2
2朱常宝,程勇,高强.基于半监督深度信念网络的图像分类算法研究[J].计算机科学,2016,43(S1):46-50. 被引量：4
3王锋,刘吉超,魏巍.基于信息熵的半监督特征选择算法[J].计算机科学,2018,45(B11):427-430. 被引量：14

引证文献1

1王省,康昭.基于光滑表示的半监督分类算法[J].计算机科学,2021,48(3):124-129. 被引量：2

二级引证文献2

1胡璇,邢凯,李亚鸣,王志勇,邓洪武.基于因果干预与不变性的卷积预训练模型优化研究[J].计算机工程,2022,48(4):89-98.
2李林珂,康昭,龙波.基于黎曼流形的多视角谱聚类算法[J].计算机工程,2023,49(1):113-120. 被引量：1

1张迪,陈真诚,梁永波,吴植强,朱健铭,钟婷婷.协同训练算法在无创血糖检测中的应用[J].中国医学物理学杂志,2018,35(11):1295-1300.
2詹煜,吴冠辰.群体智能算法在机器学习当中的应用[J].科技传播,2018,10(17):115-116. 被引量：2
3高灿,周杰,高天宇,赖志辉.不完备弱标记数据的粗糙协同学习模型[J].模式识别与人工智能,2018,31(10):950-957. 被引量：4
4付学敏.基于特征扩展的半监督协同短文本分类方法研究[J].电脑知识与技术,2018,14(10Z):205-207.
5樊奇.基于分类与回归树算法的边坡稳定性分析[J].甘肃水利水电技术,2018,54(12):32-35.
6傅聪,郝泳涛.基于强化学习的金融交易系统[J].电脑知识与技术,2018,14(12):172-175.
7郭双乐,张建光,赵鑫,耿玉菊,石龙.无监督特征选择算法的分析与总结[J].电子技术与软件工程,2019(5):181-182.
8徐阳,张忠伟,刘明.利用信息交互最优权重改进神经网络的方法[J].吉林大学学报（信息科学版）,2019,37(1):107-112. 被引量：2
9樊玮,谢聪,肖春景,曹淑燕.基于组合类别空间的随机游走推荐算法[J].计算机应用,2019,39(4):984-988. 被引量：2
10袁丁,王茜,邓李维.聚类辅助特征对齐的域适应方法[J].计算机科学,2019,46(3):221-226. 被引量：2

计算机工程

2019年第4期

浏览历史

内容加载中请稍等...

噪声可容忍的标记组合半监督学习算法被引量：1

参考文献1

二级参考文献22

共引文献24

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

噪声可容忍的标记组合半监督学习算法 被引量：1

参考文献1

二级参考文献22

共引文献24

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

噪声可容忍的标记组合半监督学习算法被引量：1