一种面向多标签分类的在线主动学习算法被引量：3

An online active learning algorithm for multi-label classification

导出

摘要针对现有算法多标签分类器收敛效率低和标签查询策略未考虑特征辨别能力的弊端,提出一种基于判别采样和镜像梯度下降规则的多标签在线主动学习算法(multi-label active mirror descent by discrimination sampling,MLAMD_D)。MLAMD_D算法采用二元关联策略将包含C个标签的多标签分类问题分解成C个相互独立的二分类问题,算法使用镜像梯度下降规则更新其二分类器,并采用基于判别的采样策略。将MLAMD_D算法与现有算法以及基于随机采样和镜像梯度下降规则的多标签在线主动学习算法(multi-label active mirror descent by random sampling,MLAMD_R)在6个多标签分类数据集上进行对比试验。试验结果表明,MLAMD_D算法的多标签分类性能优于其他多标签在线主动学习算法。因此,MLAMD_D算法在处理多标签在线主动学习的任务中具有可行性和有效性。 Multi-label active mirror descent by discrimination sampling(MLAMD_D)was proposed to overcome the drawbacks of the existing algorithms,such as low convergence efficiency of multi-label classifier and the label query strategy did not consider the discriminative ability of features.The MLAMD_D algorithm used the binary relevance strategy to decompose the multi-label classification problem with C labels into C independent binary classification problems.The MLAMD_D algorithm used the mirror descent rule to update each binary classifier,meanwhile,the algorithm adopted the discrimination-based sampling strategy.The proposed algorithm was compared with the existing algorithms and multi-label active mirror descent by random sampling algorithm(MLAMD_R)on 6 multi-label classification data sets.The convincing experimental results showed that the performance of the MLAMD_D algorithm was superior to other multi-label online active learning algorithms.Therefore,the MLAMD_D algorithm was feasible and effective when dealing with multi-label online active learning tasks.

作者龚楷伦翟婷婷唐鸿成 GONG Kailun;ZHAI Tingting;TANG Hongcheng(College of Information Engineering,Yangzhou University,Yangzhou 225127,Jiangsu,China)

机构地区扬州大学信息工程学院

出处《山东大学学报（工学版）》 CAS CSCD 北大核心 2022年第2期80-88,共9页 Journal of Shandong University（Engineering Science）

基金国家自然科学基金资助项目(61906165) 江苏省高等学校自然科学研究资助项目(19KJB520064)。

关键词在线主动学习多标签分类弱监督学习基于判别的采样策略二元关联策略 online active learning multi-label classification weakly-supervised learning discrimination-based sampling strategy binary relevance strategy

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1翟婷婷,高阳,朱俊武.面向流数据分类的在线学习综述[J].软件学报,2020,31(4):912-931. 被引量：25
2Sheng-Jun Huang,Guo-Xiang Li,Wen-Yu Huang,Shao-Yuan Li.Incremental Multi-Label Learning with Active Queries[J].Journal of Computer Science & Technology,2020,35(2):234-246. 被引量：3
3徐美香,孙福明,李豪杰.主动学习的多标签图像在线分类[J].中国图象图形学报,2015,20(2):237-244. 被引量：5

二级参考文献25

1许冠英,韩萌,王少峰,贾涛.数据流集成分类算法综述[J].计算机应用研究,2020,37(1):1-8. 被引量：11
2Schapire R E, Singer Y. BoosTexter: a boosting-based system for text categorization [J]. Machine Learning, 2000, 39(2-3): 135-168. [DOI: 10.1023/A:1007649029923].
3Hoi S C H, Jin R, Zhu J K, et al. Semi-supervised svm batch mode active learning for image retrieval [C]//Proceedings of the IEEE Computer Society Conference on Computer Vision and Patt-ern Recognition. Anchorage, AK: IEEE, 2008: 1-7. [DOI:10.1109/CVPR.2008.4587350].
4Huang S J, Jin R, Zhou Z H. Active learning by querying infor-mative and representative examples [C]//Proceedings of the 24th Annual Conference on Neural Information Processing Systems. Vancouver, British Columbia, Canada: NIPS, 2010: 892-900. [DOI:10.1109/TPAMI.2014.2307881].
5Balcan M F, Broder A Z, Zhang T. Margin based active learning [C]//Proceedings of the 20th Annual Conference on Learning Theory. San Diego, CA, USA: Springer Berlin Heidelberg, 2007: 35-50.
6Freund Y, Seung H S, Shamir E, et al. Selective sampling using the query by committee algorithm [J]. Journal of Machine Learning, 1997, 28(2-3): 133-168. [DOI: 10.1023/A:1007330508534].
7Yu K, Bi J, Tresp V. Active learning via transductive experimental design [C]//Proceedings of the 23rd International Conference on Machine Learning. Pittsburgh, Pennsylvania, USA: ACM, 2006: 1081-1088. [DOI: 10.1145/1143844.1143980].
8Dasgupta S, Hsu D. Hierachical sampling for active learning [C]//Proceedings of the 25th International Conference on Machine Learning. New York, USA: ACM, 2008: 208-215.
9Donmwz P, Carbonell J G, Bennett P N. Dual strategy active learning [C]//Proceedings of the 18th European Conference on Machine Learning. Berlin: Springer, 2007: 116-127. [DOI: 10.1007/978-3-540-74958-5_14].
10Nguyen H T, Smeulder A W. Active learning using pre-clustering [C]//Proceedings of the 21st International Conference on Machine Learning. New York, USA: ACM, 2004: 623-630.

共引文献30

1杨菊,李青雯,于化龙.适用于单轮单样例标注场景的主动学习停止准则[J].计算机应用,2015,35(12):3472-3476.
2张丽娜,戴灵鹏,匡泰.一种适应于非完备标签数据和标签关联性的多标签分类方法[J].电信科学,2016,32(8):82-89.
3刘娜,毛晓菊,吴敏.集群分类映射的文本多标签模糊关联降维聚类[J].计算机工程与设计,2017,38(6):1657-1663. 被引量：4
4王长宝,李青雯,于化龙.面向类别不平衡数据的主动在线加权极限学习机算法[J].计算机科学,2017,44(12):221-226. 被引量：2
5Qing Tian,Chuang Ma,Feng-Yuan Zhang,Shun Peng,Hui Xue.Source-Free Unsupervised Domain Adaptation with Sample Transport Learning[J].Journal of Computer Science & Technology,2021,36(3):606-616. 被引量：1
6尹春勇,张帼杰.面向分布式漂移数据流的集成分类模型[J].计算机应用,2021,41(7):1947-1955. 被引量：5
7刘艳芳,李文斌,高阳.基于被动-主动的特征演化流学习[J].计算机研究与发展,2021,58(8):1575-1585. 被引量：3
8周宇,曹英楠,王永超.面向大数据的数据处理与分析算法综述[J].南京航空航天大学学报,2021,53(5):664-676. 被引量：26
9任婷婷,鲁统宇,崔俊.基于改进AdaBoost算法的动态不平衡财务预警模型[J].数量经济技术经济研究,2021,38(11):182-196. 被引量：15
10郭虎升,任巧燕,王文剑.基于时序窗口的概念漂移类别检测[J].计算机研究与发展,2022,59(1):127-143. 被引量：10

同被引文献28

1王海泉,侯宇亮,魏建华,徐晓滨,苏孟豪,张姗姗.基于多目标蜂群算法的数据分类方法[J].重庆大学学报（自然科学版）,2020,43(1):74-81. 被引量：4
2李郅琴,杜建强,聂斌,熊旺平,黄灿奕,李欢.特征选择方法综述[J].计算机工程与应用,2019,55(24):10-19. 被引量：125
3张银芳,于洪,王国胤,谢永芳.一种用于数据流自适应分类的主动学习方法[J].南京大学学报（自然科学版）,2020,56(1):67-73. 被引量：10
4翟婷婷,高阳,朱俊武.面向流数据分类的在线学习综述[J].软件学报,2020,31(4):912-931. 被引量：25
5释小松,程英蕾,薛豆豆,秦先祥.基于Point-Net的多源融合点云地物分类方法[J].激光与光电子学进展,2020,57(8):170-178. 被引量：16
6杨岚雁,靳敏,张迎春,张珣.一种基于关联规则的MLKNN多标签分类算法[J].计算机工程与科学,2020,42(7):1309-1317. 被引量：9
7牟甲鹏,蔡剑,余孟池,徐建.基于标签相关性的类属属性多标签分类算法[J].计算机应用研究,2020,37(9):2656-2658. 被引量：12
8张向荣.基于子空间多核学习的企业财务困境预测方法[J].运筹与管理,2021,30(1):184-191. 被引量：5
9施伟,黄红蓝,冯旸赫,刘忠.面向多类别分类问题的子抽样主动学习方法[J].系统工程与电子技术,2021,43(3):700-708. 被引量：1
10范纯龙,王翼新,宿彤,张振鑫.基于样本冗余度的主动学习优化方法[J].计算机应用与软件,2021,38(3):291-297. 被引量：2

引证文献3

1张永伟,朱祁,吴永城.基于分解策略的多标签在线特征选择算法[J].网络安全与数据治理,2022,41(10):65-71.
2高溪,王良浩.基于SVM主动学习的制革企业财务管理数据分类方法[J].皮革与化工,2023,40(6):17-22.
3曾聪.基于分类查询的不动产测绘一体化管理系统[J].西部资源,2024(1):110-112.

1崔新悦,阳周明,赵彦东,杨霄,范玲瑜.一种针对坦克速度控制的深度强化学习算法[J].火力与指挥控制,2022,47(4):120-125. 被引量：1
2侯夏晔,陈海燕,张兵,袁立罡,贾亦真.一种基于支持向量机的主动度量学习算法[J].计算机科学,2022,49(S01):113-118. 被引量：2
3陈琼,谢家亮.基于自适应采样的不平衡分类方法[J].华南理工大学学报（自然科学版）,2022,50(4):26-34. 被引量：3
4李珊如,周岩,乔晓辉,杨丹青,王志刚.一种面向问答系统的多标签答案检索模型[J].电子制作,2022,30(10):92-94.
5胡健阳,段先华,马启星.基于粒子群优化粒子滤波的声呐目标检测前跟踪[J].船舶工程,2022,44(1):91-95. 被引量：4
6杨基宏,陈浩林,吴海平,曹子杰,段铸,台永丰,师小龙,李燕飞.基于ICA的轨道交通系统数据模拟方法[J].中国高新科技,2022(6):67-68.
7刘安邦,施赛楠,杨静,曹鼎.基于虚警可控梯度提升树的海面小目标检测[J].南京信息工程大学学报（自然科学版）,2022,14(3):341-347. 被引量：5
8邓绍斌,朱军,周晓锋,李帅,刘舒锐.基于局部策略交互探索的深度确定性策略梯度的工业过程控制方法[J].计算机应用,2022,42(5):1642-1648. 被引量：1
9Kehinde T. Oyatayo,Godwin A. Songu,Timothy A. Adi,Godwill G. Jidauna,Christopher Ndabula.Assessment of People’s Awareness and Perception of Flooding in Donga Town, Taraba State, Nigeria[J].Journal of Geoscience and Environment Protection,2016,4(5):54-62.
10赵鑫,刘晓勇,苏铁熊,任日娜,郭亚新.基于改进NSGA-Ⅱ的主轴承组合结构协调匹配设计方法研究[J].车用发动机,2022(3):59-68.

山东大学学报（工学版）

2022年第2期

浏览历史

内容加载中请稍等...

一种面向多标签分类的在线主动学习算法被引量：3

参考文献3

二级参考文献25

共引文献30

同被引文献28

引证文献3

相关作者

相关机构

相关主题

浏览历史

一种面向多标签分类的在线主动学习算法 被引量：3

参考文献3

二级参考文献25

共引文献30

同被引文献28

引证文献3

相关作者

相关机构

相关主题

浏览历史

一种面向多标签分类的在线主动学习算法被引量：3