一种基于关联规则的MLKNN多标签分类算法被引量：9

A MLKNN multi-label classification algorithm based on association rules

下载PDF

导出

摘要针对MLKNN算法仅对独立标签进行处理,忽略现实世界中标签之间相关性这一问题,提出了一种基于关联规则的MLKNN多标签分类算法(FP-MLKNN)。该算法采用关联规则算法挖掘标签之间的高阶相关性,并用标签之间的关联规则改进MLKNN算法,以达到提升分类性能的目的。首先,使用MLKNN算法求样本的特征置信度;采用关联规则算法挖掘生成一系列强关联规则,进而将2种算法进行融合来构造多标签分类器,对新标签进行预测;在此基础上,将本文提出的算法与MLKNN、AdaBoostMH和BPMLL这3种算法进行实验对比。实验结果表明,本文所提算法在yeast、emotions和enron数据集上的分类性能均优于这3种算法,具有较好的分类效果。 Aiming at the problem that the MLKNN algorithm ignores the correlation between labels in the real world when dealing with independent labels,this paper proposes an MLKNN multi-label classification algorithm(FP-MLKNN)based on association rules.The algorithm uses association rules to mine high-order correlations between labels,and applies the association rules between labels to the MLKNN algorithm for improvement to achieve the purpose of improving the classification performance.Firstly,the MLKNN algorithm is used to obtain the characteristic confidence of the sample.Secondly,the association rule algorithm is used to mine and generate a series of strong association rules.Thirdly,the two algorithms are fused to construct a multi-label classifier to predict new labels.Experimental results show that the proposed algorithm has better classification performance than MLKNN,AdaBoostMH and BPMLL algorithms on yeast,emotions,and enron datasets,achieving a good classification effect.

作者杨岚雁靳敏张迎春张珣 YANG Lan-yan;JIN Min;ZHANG Ying-chun;ZHANG Xun(School of computer and information engineering,Beijing Technology and Business University,Beijing 100048;Information Network Center,Beijing Technology and Business University,Beijing 100048,China)

机构地区北京工商大学计算机与信息工程学院北京工商大学信息网络中心

出处《计算机工程与科学》 CSCD 北大核心 2020年第7期1309-1317,共9页 Computer Engineering & Science

基金北京市属高校高水平教师队伍建设支持计划(CIT&TCD201904037) 中国博士后科学基金(2017M620885)。

关键词多标签分类 MLKNN 关联规则高阶相关性 multi-label classification MLKNN association rules high order correlation

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1LIU Yaolin,XIE Peng,HE Qingsong,ZHAO Xiang,WEI Xiaojian,TAN Ronghui.A New Method Based on Association Rules Mining and Geo-filter for Mining Spatial Association Knowledge[J].Chinese Geographical Science,2017,27(3):389-401. 被引量：6
2Yue-peng ZOU,Ji-hong OUYANG,Xi-ming LI.Supervised topic models with weighted words:multi-label document classification[J].Frontiers of Information Technology & Electronic Engineering,2018,19(4):513-523. 被引量：1
3Zhiling Cai,William Zhu.Feature Selection for Multi-label Classification Using Neighborhood Preservation[J].IEEE/CAA Journal of Automatica Sinica,2018,5(1):320-330. 被引量：10
4Jiang-Hui Cai,Xu-Jun Zhao,Shi-Wei Sun,Ji-Fu Zhang,Hai-Feng Yang.Stellar spectra association rule mining method based on the weighted frequent pattern tree[J].Research in Astronomy and Astrophysics,2013,13(3):334-342. 被引量：4
5张敏灵.一种新型多标记懒惰学习算法[J].计算机研究与发展,2012,49(11):2271-2282. 被引量：39

二级参考文献78

1Schapire R E, Singer Y. BoosTcxter: A boostnlg bsed syslem for text categorizaion[J]. Machine Lcarning . 39(2/3): 135- 168.
2McCallum A. Muhi-lahcl lext classification with a micture model trained by EM[C] //Proc of *he Working Nolcs of 11/ AAAI'99 Workshop on Text I.earning. Menlo Park, CA: AAAI Press, 1999.
3Elissecff A, Weston J. A kcrtxel method for multi -labeclledclassification [C] //Advances in Neural Informalion Processing Systcms 14. Cambridge, MA: M1T Press, 2002: 681 -687.
4QiGJ, HuaX S, Rui Y, et al. Corrclaativcmulti label vidco annotation [C] //Proc of the 15th ACM Int Conf on Muhimedia. New York: ACM, 2007:17- 26.
5Aha D W. Specied A1 review issoe on lazy learning [J ]. Artificial Intelligcnce Review, 1997. 11(1/2/3/4/5): 7 -10.
6Zhang M L,, Zhou Z H. ML-hNN: A lazy lcarning approach to multi label learning [J]. Paltern Recognition, 2007. 10 (7): 2038 -2048.
7Freund Y, Sc:hapire R E. A dccision theoretic gcncralization of on-linc learning and an applocation to boosting[G]//Lecture Notcs in Computer Scicnce 904.Bcrlin:Springer.1995:23-37.
8Dempstcr A P, 1.aird N M, Rubin D B+ Maxitnuntlikclihood from incomplete data via the EM algorithm[J].Journal of the Royal Statistics Socicty B, 1977, 39(1): 1-38.
9Ueda N, Saito K. Parametric mixturc models for multi label text [C] //Advances in Neural Information Processing Systems 15. Cambridge, MA= MITPress, 2003:721-728.
10Dumais S T, Platt J, Heckerman D, et al. Inductive learning algorithm and representation for text categorization [C]// Proc of the 7th ACM Int Conf on Information and Knowledge Management. New York: ACM, 1998= 148-155.

共引文献55

1琚玉建,谢绍斌,张薇.基于自适应权值的数据报指纹特征识别与发现[J].计算机测量与控制,2014,22(7):2288-2290. 被引量：8
2何志芬,杨明,刘会东.多标记分类和标记相关性的联合学习[J].软件学报,2014,25(9):1967-1981. 被引量：21
3赵玉丹,王倩,范九伦,刘颖,高梓铭.基于模糊KNN的刑侦图像场景分类[J].计算机应用研究,2014,31(10):3158-3160. 被引量：9
4赵海峰,余强,曹俞旦.基于粒计算的多标签懒惰学习算法[J].计算机科学,2014,41(12):160-163. 被引量：2
5吕静,何志芬.一种基于正则化最小二乘的多标记分类算法[J].南京大学学报（自然科学版）,2015,51(1):139-147. 被引量：3
6高嘉伟,梁吉业,刘杨磊,李茹.一种基于Tri-training的半监督多标记学习文档分类算法[J].中文信息学报,2015,29(1):104-110. 被引量：8
7李书玲,刘蓉,刘红.改进型RBF神经网络的多标签算法研究[J].计算机科学,2015,42(4):316-320. 被引量：8
8张钢,钟灵,黄永慧.一种病理图像自动标注的机器学习方法[J].计算机研究与发展,2015,52(9):2135-2144. 被引量：6
9檀何凤,刘政怡.基于标签相关性的K近邻多标签分类方法[J].计算机应用,2015,35(10):2761-2765. 被引量：10
10徐晓丹,刘华文,姚明海,刘日仙.一种基于局部加权回归的分类方法[J].计算机工程与科学,2015,37(10):1959-1964. 被引量：4

同被引文献95

1郭玉雪,于洪丽,么航,杜博爱,王春方.基于离散小波变换的卷积自编码运动想象脑电信号的分类[J].电子测量技术,2023,46(19):188-196. 被引量：2
2赵露.基于聚类分析的网络安全数据特征可视化融合研究[J].长春工程学院学报（自然科学版）,2020(2):94-97. 被引量：3
3LONG Jiangqi LAN Fengchong CHEN Jiqing YU Ping.Mechanical Properties Prediction of the Mechanical Clinching Joints Based on Genetic Algorithm and BP Neural Network[J].Chinese Journal of Mechanical Engineering,2009,22(1):36-41. 被引量：22
4张欣,梁宗保.多分类器融合算法研究与应用[J].湘潭大学自然科学学报,2011,33(2):99-103. 被引量：5
5孟军,王蓬,张静,王秀坤.基于项集依赖的最小关联规则挖掘[J].计算机科学,2013,40(1):183-186. 被引量：10
6陈艳秋,李海波.一种基于本体的关联规则挖掘方法[J].黑龙江大学自然科学学报,2014,31(6):825-830. 被引量：2
7孙伟,张俊升,邢培锐.基于随机森林的乳腺肿瘤细针穿刺辅助诊断[J].计算机应用,2015,35(A02):143-145. 被引量：5
8冯雪东.多标签分类问题综述[J].信息系统工程,2016,29(3):137-137. 被引量：7
9齐浩淳,黄大鹏,魏久南,陈志刚.基于BP神经网络的高寒山地弹药消耗需求分析[J].兵器装备工程学报,2016,37(6):97-101. 被引量：12
10杨英杰,邱卫.基于时间衰减模型的模糊会话关联规则挖掘算法[J].计算机应用研究,2017,34(1):128-131. 被引量：6

引证文献9

1杨伟杰,薛河儒,白洁.牛乳体细胞分类器的研究与实现[J].数字技术与应用,2021,39(7):114-116. 被引量：1
2程大勇.基于k近邻的多标签分类算法性能比较[J].太原学院学报（自然科学版）,2022,40(1):59-64. 被引量：5
3李悦,汤鲲.基于TextCNN的政策文本分类[J].电子设计工程,2022,30(12):43-47. 被引量：3
4张永伟,朱祁,吴永城.基于分解策略的多标签在线特征选择算法[J].网络安全与数据治理,2022,41(10):65-71.
5田珂.基于聚类关联规则神经网络组合算法的弹丸初速预测[J].兵工学报,2023,44(2):452-461.
6姜建武,王博.高维数据组合关联关系挖掘方法[J].科学技术与工程,2023,23(4):1615-1624. 被引量：1
7杜昉臻,何圆姣,冯西贝,刘国华.基于人工智能的中医证候分类算法研究[J].南开大学学报（自然科学版）,2023,56(2):12-16. 被引量：2
8肖建芳,刘缅芳.基于稀疏正则化的加权叠加集成多标签分类[J].计算机应用与软件,2024,41(5):286-297.
9周伟,牛誉蓉.基于K-近邻与FOA改进聚类的数据异常分析模型及用电行为分析[J].成都工业学院学报,2024,27(5):11-16.

二级引证文献12

1马群凯,王齐,冯立胜,李颖,赵碧君.语义分析在进出口商品申报信息智能判别场景中的应用[J].中国口岸科学技术,2023,5(S01):55-59.
2王朝晖,康欢,陈多芳,徐欣怡,曾琦,梁继民,陈雪利.轻量化深度网络辅助于无透镜计算显微图像的细胞分类[J].中国激光,2022,49(5):130-138. 被引量：3
3张雪晴.基于CNN的图像分类[J].电子技术与软件工程,2022(7):182-185. 被引量：3
4裴文华.基于机器学习的红酒质量分类研究[J].科技和产业,2022,22(12):304-309.
5刘乙萱,苏鑫.基于两阶段迁移学习的 Multi-scale SE-ResNet50深度卷积神经网络的多标签航空图像分类问题研究[J].数学的实践与认识,2023,53(6):174-186.
6王俊文,岳广欣,赵辉,梁媛,杜松,于峥,张华敏.2023年中医诊断学研究进展[J].中国中医基础医学杂志,2024,30(3):390-397. 被引量：1
7谭超,朱荣钊.基于改进LANDMARC定位算法的人员定位技术研究[J].长春工程学院学报（自然科学版）,2024,25(1):90-95. 被引量：1
8韩春磊,苏宇,张玉志.基于知识库的元类别医学期刊文章分类模型[J].南开大学学报（自然科学版）,2024,57(1):116-120.
9保志康,陈继璇,刘印晓,张茂源,章洪博,刘振安,魏晓娟.基于机器学习的DNA序列分类研究[J].生物化工,2024,10(3):20-27.
10唐增金,徐贞顺,苏梦瑶,刘纳,王振彪,张文豪.频繁时序模式挖掘方法综述[J].计算机工程与应用,2024,60(17):48-61.

1赵泉华,王肖,李玉,王光辉.基于多特征加权的SAR影像舰船检测优化方法[J].通信学报,2020,41(3):91-101. 被引量：5
2朱天放,胡书山,余日季,李文靖.基于多视角图与卷积神经网络的三维模型检索算法[J].湖北大学学报（自然科学版）,2020,42(3):325-333. 被引量：3
3梁美玲.Untranslatable Cultural Experiences in Metaphor[J].校园英语,2020(14):241-242.
4佟彤,罗森林,潘丽敏,张铁梅.基于深度森林的量表数据挖掘方法[J].电子设计工程,2020,28(13):88-91. 被引量：4
5Yu Pan,Peng-Xi Liu,Fei-Fei Hong,Xiao-Jun Li.The impact of mindfulness therapy on life happiness of the elderly in nursing homes[J].Psychosomatic Medicine Research,2020,2(2):39-45.
6张程,王进,鲁晓卉,陆国栋,唐小林,李文萃.基于图像颜色和纹理特征的成品茶种类与等级识别[J].中国茶叶加工,2020(2):5-11. 被引量：10
7王修信,杨路路,汤谷云,罗涟玲,孙涛,潘玉英.利用卷积神经网络提取高分辨率遥感图像喀斯特森林信息[J].科学技术与工程,2020,20(17):6773-6777. 被引量：6
8沈璐,王倩婷,施俊.基于特权信息集成学习的精神分裂症单模态神经影像计算机辅助诊断[J].生物医学工程学杂志,2020,37(3):405-411.
9邢新颖,冀俊忠,姚垚.基于自适应多任务卷积神经网络的脑网络分类方法[J].计算机研究与发展,2020,57(7):1449-1459. 被引量：9

计算机工程与科学

2020年第7期

浏览历史

内容加载中请稍等...

一种基于关联规则的MLKNN多标签分类算法被引量：9

参考文献5

二级参考文献78

共引文献55

同被引文献95

引证文献9

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

一种基于关联规则的MLKNN多标签分类算法 被引量：9

参考文献5

二级参考文献78

共引文献55

同被引文献95

引证文献9

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

一种基于关联规则的MLKNN多标签分类算法被引量：9