基于标签相关性的K近邻多标签分类方法被引量：12

Multi-label K nearest neighbor algorithm by exploiting label correlation

下载PDF

导出

摘要针对K近邻多标签（ML-KNN）分类算法中未考虑标签相关性的问题,提出了一种基于标签相关性的K近邻多标签分类（CML-KNN）算法。首先,计算出标签集合中每对标签间的条件概率;其次,对于即将被预测的标签,将其与已经预测的标签间的条件概率进行排序,求出最大值;最后,将最大值跟对应标签值相乘同时结合最大化后验概率（MAP）来构造多标签分类模型,对新标签进行预测。实验结果表明,所提算法在Emotions数据集上的分类性能均优于ML-KNN、Adaboost MH、RAk EL、BPMLL这4种算法;在Yeast、Enron数据集上仅在1-2个评价指标上低于MLKNN与RAk EL算法。由实验分析可知,该算法取得了较好的分类效果。 Since the Multi-Label K Nearest Neighbor （ML-KNN） classification algorithm ignores the correlation between labels, a multi-label classification algorithm by exploiting label correlation named CML-KNN was proposed. Firstly, the conditional probability between each pair of labels was calculated. Secondly, the conditional probabilities of predicted labels and the conditional probability of the label to be predicted were ranked, then the maximum was got. Finally, a new classification model by combining Maximum A Posteriori （MAP） and the product of the maximum and its corresponding label value was proposed and the new label value was predicted. The experimental results show that the performance of CML-KNN on Emotions dataset outperforms the other four algorithms, namely ML-KNN, AdaboostMH, RAkEL, BPMLL, while only two evaluation metric values are lower than those of ML-KNN and RAkEL on Yeast and Enron datasets. The experimental analyses show that CML-KNN obtains better classification results.

作者檀何凤刘政怡

机构地区安徽大学计算机科学与技术学院

出处《计算机应用》 CSCD 北大核心 2015年第10期2761-2765,共5页 journal of Computer Applications

基金安徽省科技攻关计划项目(1301b042020) 高等学校博士学科点专项科研基金资助项目(20133401110009) 安徽大学研究生学术创新项目(Ygh100166)

关键词标签相关性 K近邻多标签条件概率多标签分类 label correlation Multi-Label K Nearest Neighbor （ML-KNN） conditional probability muhi-label classification

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1TSOUMAKAS G, KATAKIS I. Muhi-label classification: an over- view[ J]. Database Technologies Concepts Methodologies Tools and Applications, 2007,2007(3): 1 -13.
2BOUTELL M R, LOU J, SHEN X, et al. Learning multi-label scene classification[ J]. Pattern Recognition, 2004, 37(9) : 1757 - 1771.
3HUANG S-J, ZHOU Z-H. Multi-tabel teaming by exploiting label correlations locally[ C]// AAAI 2012: Proceedings of the 26th AAAI Conference on Artificial Intelligence. Menlo Park: AAAI Press, 2012:949 -955.
4ZHANG M, ZHANG K. Multi-label learning by exploiting label de- pendency[ C]//KDD 2010: Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2010:999 - 1008.
5ZHANG M, ZHOU Z. Multi-label neural networks with applications to functional genomics and text categorization [ J]. IEEE Transac- tions on Knowledge and Data Engineering, 2006, 18(10) : 1338 -1351.
6SCHAPIRE R E, SINGER Y. BoosTexter: a boosting-based system for text categorization[ J]. Machine Learning, 2000, 39(2/3) : 135 - 168.
7ZHANG M-L, ZHOU Z-H. ML-KNN: a lazy learning approach to multi-label learning[J]. Pattern Recognition, 2007, 40(7) :2038 - 2048.
8TSOUMAKAS G, VLAHAVAS I. Random k-Labelsets: an ensem- ble method for multi-label classification [ C]// ECML 2007: Pro- ceedings of the 18th European Conference on Machine Learning, LNCS 4701, Berlin: Springer-Verlag, 2007:406 -417.
9READ J, PFAHRINGER B, HOLMES G, et al. Classifier chains for multi-label classification[ C]//ECML PKDD 2009: Proceedings of the 2009 European Conference on Machine Learning and Knowl- edge Discovery in Databases, LNCS 5782. Berlin: Springer-Verlag, 2009:254-269.
10郑伟,王朝坤,刘璋,王建民.一种基于随机游走模型的多标签分类算法[J].计算机学报,2010,33(8):1418-1426. 被引量：57

二级参考文献78

1Shen X,Boutell M,Luo J,Brown C.Multi-label machine learning and its application to semantic scene classification//Proceedings of the 2004 International Symposium on Electronic Imaging.San Jose,California,USA,2004:18-22.
2Hullermeier E,Furnkranz J,Cheng W,Brinker K.Label ranking by learning pairwise preferences.Artificial Intelligence,2008,172(16):1897-1916.
3Read J.A pruned problem transformation method for multi-label classification//Proceedings of the New Zealand Computer Science Research Student Conference.New Zealand,2008:143-150.
4Tsoumakas G,Vlahavas I.Random k-labelsets:An ensemble method for multilabel classification//Proceedings of the ECML.Warsaw,Poland,2007:406-417.
5Schapire R,Singer Y.BoosTexter:A boosting-based system for text categorization.Machine Learning,2000,39(2):135-168.
6Zhang M,Zhou Z.Multilabel neural networks with applications to functional genomics and text categorization.IEEE Transactions on Knowledge and Data Engineering,2006,18(10):1338-1351.
7Zhang M,Zhou Z.A k-nearest neighbor based algorithm for multi-label classification//Proceedings of the IEEE International Conference on Granular Computing.Beijing,China,2005,2:718-721.
8Clare A,King R.Knowledge discovery in multi-label phenotype data//Proceedings of the ECML/KDD.Freiburg,Germany,2001:42-53.
9Tsoumakas G,Dimou A,Spyromitros E,Mezaris V,Kompatsiaris I,Vlahavas I.Correlation-based pruning of stacked binary relevance models for multi-label learning//Proceedings of the ECML/PKDD.Slovenia,2009:101.
10Page L,Brin S,Motwani R,Winograd T.The pagerank citation ranking:Bringing order to the web//Proceedings of the ASIS.Orlando,FL,1998:161-172.

共引文献92

1喻金平,郑杰,朱桂祥.基于多关系网络的社区检测算法[J].系统仿真学报,2015,27(1):147-154. 被引量：1
2孙伟平,向杰,陈加忠,余胜生.基于GPU的粒子滤波并行算法[J].华中科技大学学报（自然科学版）,2011,39(5):63-66. 被引量：11
3赵卫红.海洋中胶体研究的新进展[J].海洋与湖沼,2000,31(2):221-229. 被引量：11
4蒋华,戚玉顺.基于球结构支持向量机的多标签分类的主动学习[J].计算机应用,2012,32(5):1359-1361. 被引量：3
5任梅,詹永照,潘道远,孙佳瑶.基于概率超图的视频事件语义检测[J].计算机应用,2012,32(11):3014-3017. 被引量：1
6蒋华,戚玉顺.基于球结构SVM的多标签分类[J].计算机工程,2013,39(1):294-297. 被引量：6
7范海雄,刘付显,夏璐.基于概率LS-SVM的多标签非均衡样本分类算法[J].解放军理工大学学报（自然科学版）,2013,14(2):169-175.
8李思男,李宁,李战怀.多标签数据挖掘技术:研究综述[J].计算机科学,2013,40(4):14-21. 被引量：32
9张振海,李士宁,李志刚,陈昊.一类基于信息熵的多标签特征选择算法[J].计算机研究与发展,2013,50(6):1177-1184. 被引量：62
10林霄,肖国强,吴松,邱开金.基于随机游走模型的物体识别[J].计算机工程与应用,2013,49(21):145-151.

同被引文献95

1李静,李幸芝,韩蓓,李国杰,王志磊.考虑分布式电源不确定性与相关性的配电网状态估计[J].全球能源互联网,2020,0(3):231-237. 被引量：10
2张若兵,金森,杜钢.基于EMD与DTW算法的振荡波下电缆局部放电定位方法[J].高电压技术,2020,46(1):273-281. 被引量：28
3陈坚,刘思议,金涛.基于SURE小波阈值消噪和MCEEMD-HHT的低频振荡分析[J].高电压技术,2020,46(1):151-160. 被引量：21
4向晖,郭一平,王亮.基于Lucene的中文字典分词模块的设计与实现[J].现代图书情报技术,2006(8):46-50. 被引量：27
5王皓,孙宏斌,张伯明.PG-HMI:一种基于互信息的特征选择方法[J].模式识别与人工智能,2007,20(1):55-63. 被引量：6
6彭京,杨冬青,唐世渭,付艳,蒋汉奎.一种基于语义内积空间模型的文本聚类算法[J].计算机学报,2007,30(8):1354-1363. 被引量：44
7温小霓,蔡汝骏.分类与回归树及其应用研究[J].统计与决策,2007,23(23):14-16. 被引量：14
8熊忠阳,蒋健,张玉芳.新的CDF文本分类特征提取方法[J].计算机应用,2009,29(7):1755-1757. 被引量：11
9赵俊,杨洪耕,李伟.利用S变换与变尺度模板标准化的短时电能质量扰动分类[J].南方电网技术,2010,4(3):72-76. 被引量：8
10郑伟,王朝坤,刘璋,王建民.一种基于随机游走模型的多标签分类算法[J].计算机学报,2010,33(8):1418-1426. 被引量：57

引证文献12

1瞿合祚,李晓明,陈陈,何乐.基于卷积神经网络的电能质量扰动分类[J].武汉大学学报（工学版）,2018,51(6):534-539. 被引量：34
2宋才华,陈春梅,邓乾.供电企业存量客户用电地址数据结构化与规范化的清理方法研究[J].微型电脑应用,2018,34(10):78-80. 被引量：2
3韩栋,王春华,肖敏.结合旋转森林和Ada Boost分类器的多标签文本分类方法[J].计算机应用研究,2018,35(12):3655-3658. 被引量：10
4李兆玉,王纪超,雷曼,龚琴.基于引力模型的多标签分类算法[J].计算机应用,2018,38(10):2807-2811. 被引量：7
5陆凯,徐华.ML-kNN算法在大数据集上的高效应用[J].计算机工程与应用,2019,55(1):84-88. 被引量：6
6陆凯,徐华.基于最近邻距离权重的ML-KNN算法[J].计算机应用研究,2020,37(4):982-985. 被引量：4
7王礼云,辛月兰.基于卷积神经网络和层次标签集扩展的文本分类方法[J].西北师范大学学报（自然科学版）,2021,57(2):48-54. 被引量：2
8郑炜,林瑞全,王俊,李振嘉.基于GAF与卷积神经网络的电能质量扰动分类[J].电力系统保护与控制,2021,49(11):97-104. 被引量：56
9张述睿,张伯政,张福鑫,杨万春.面向ICD疾病分类的深度学习方法研究[J].计算机工程与应用,2021,57(18):172-180. 被引量：1
10吕学强,彭郴,张乐,董志安,游新冬.融合BERT与标签语义注意力的文本多标签分类方法[J].计算机应用,2022,42(1):57-63. 被引量：14

二级引证文献132

1季德强,王海荣,车淼,王嘉鑫.KNN-GWD推荐模型及其应用[J].应用科学学报,2022,40(1):145-154. 被引量：1
2李淑艳,李若晨,温昌凯,万科科,宋正河,刘江辉.基于GAF-DenseNet的旋耕作业质量等级识别模型[J].农业机械学报,2022,53(11):441-449.
3肖东升,鲁恩铭,刘福臻.旋转森林与极限学习相结合的遥感影像分类方法[J].遥感信息,2019,34(3):93-98. 被引量：1
4程子为,曾子维,张诗尧,孙谋.基于数据引力模型的改进多标签算法[J].辽宁科技大学学报,2019,42(3):202-208.
5孙鑫亮,杨涛,章颖,董海艳,胡孔法,谢佳东,史话跃.基于ML-KNN算法的冠心病辨证模型研究[J].山东中医药大学学报,2019,43(5):438-442. 被引量：2
6杨晓楠,吕国强,侯鹏飞,毕贵红.基于ESMD与SVM的电能质量混合扰动识别[J].软件导刊,2019,18(11):42-47. 被引量：1
7黄应敏,胡超强,邹科敏,尤占山.基于混合式拓扑的智能化电能质量检测系统[J].电子设计工程,2019,27(23):68-72. 被引量：2
8李江岱.基于离群模型的异常大数据检测方法研究[J].新一代信息技术,2019,2(14):56-60.
9王维博,张斌,曾文入,董蕊莹,郑永康.基于特征融合一维卷积神经网络的电能质量扰动分类[J].电力系统保护与控制,2020,48(6):53-60. 被引量：45
10赵洛印,庄磊,丁建顺,马亚彬,李宏伟,王振.基于S&TT变换与PSO-SVMs的电能质量混合扰动识别[J].电测与仪表,2020,57(4):78-86. 被引量：7

1J.A.RINCON,J.BAJO,A.FERNANDEZ,V.JULIAN,C.CARRASCOSA.Using emotions for the development of human-agent societies[J].Frontiers of Information Technology & Electronic Engineering,2016,17(4):325-337.
2程圣军,黄庆成,刘家锋,唐降龙.一种改进的ML-kNN多标记文档分类方法[J].哈尔滨工业大学学报,2013,45(11):45-49. 被引量：4
3钱燕燕,李永忠,章雷,余西亚.一种多标记学习入侵检测算法[J].合肥工业大学学报（自然科学版）,2015,38(7):929-933. 被引量：3
4钱燕燕,李永忠,余西亚.基于多标记与半监督学习的入侵检测方法研究[J].计算机科学,2015,42(2):134-136. 被引量：15
5王霄,周李威,陈耿,朱玉全.一种基于标签相关性的多标签分类算法[J].计算机应用研究,2014,31(9):2609-2612. 被引量：9
6孙艳歌,邵罕,李艳灵.考虑标记间依赖关系的多标记分类算法[J].信阳师范学院学报（自然科学版）,2016,29(2):279-282. 被引量：1
7几招小技巧让FlashGet使用更上一层耧[J].计算机与网络,2006,32(8):48-48.
8许朝阳.基于多标记文本分类的ML-KNN改进算法[J].江苏师范大学学报（自然科学版）,2012,30(3):27-30. 被引量：1
9刘卓然,胡杨,刘骊,冯旭鹏,刘利军,黄青松.基于标签相似度的不良信息多标签分类方法[J].计算机应用研究,2016,33(4):989-992. 被引量：8
10Kang Xin,Ren Fuji.Predicting Complex Word Emotions and Topics through a Hierarchical Bayesian Network[J].China Communications,2012,9(3):99-109. 被引量：2

计算机应用

2015年第10期

浏览历史

内容加载中请稍等...

基于标签相关性的K近邻多标签分类方法被引量：12

参考文献13

二级参考文献78

共引文献92

同被引文献95

引证文献12

二级引证文献132

相关作者

相关机构

相关主题

浏览历史

基于标签相关性的K近邻多标签分类方法 被引量：12

参考文献13

二级参考文献78

共引文献92

同被引文献95

引证文献12

二级引证文献132

相关作者

相关机构

相关主题

浏览历史

基于标签相关性的K近邻多标签分类方法被引量：12