基于粒计算的K近邻多标签学习算法被引量：4

K-nearest Neighbor Multi-label Learning Algorithm Based on Granular Computing

下载PDF

导出

摘要 K近邻多标签学习算法的近邻点个数取固定值,而没有考虑样本分布的特点,可能会将相似度高的点排除在近邻集外,或者将相似度低的点包含在近邻集内,影响分类器的性能。为此,将粒计算的思想引入近邻集的构建,提出一种新的K近邻多标签学习算法。通过粒度控制,确定近邻点集,使得领域内的样本点有高相似性,且此类样本能进入近邻集。实验结果表明,该算法的大多数评价指标均优于现有的多标签学习算法。 In Multi-label K-nearest Neighbor（ML-KNN） learning algorithm, the number of nearest neighbors is given in prior and its value is chosen without considering the distribution of samples, it is possible that highly similar samples are not in the nearest neighbor or low similar samples are in the nearest neighbor set, which affect the performance of the classifier. In view of this case, a novel ML-KNN algorithm is put forward based on the idea of Granular Computing（GrC）, the nearest neighbor set is constructed with the controlling of the granular hierarchy, and the nearest neighbors of a sample have high similarity and highly similar samples can be added to nearest neighbor set. Experimental results show that most of the evaluation criteria in new algorithm are better than the traditional algorithm.

作者陈小波吴涛高正龙

机构地区安徽大学数学科学学院

出处《计算机工程》 CAS CSCD 2012年第22期167-170,175,共5页 Computer Engineering

基金国家自然科学基金资助项目(61073117) 国家"973"计划基金资助项目(2007BC311003) 安徽大学学术创新团队基金资助项目(KJTD001B) 安徽大学研究生学术创新基金资助项目(yfc090008)

关键词多标签学习粒计算 K近邻粒度评价指标 multi-label learning Granular Computing（GrC） K-nearest Neighbor（KNN） granularity evaluation index

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献8

1Schapire R E, Singer Y. BoosTexter: A Boosting Based System for Text Categorization[J]. Machine Leaning, 2000, 39(2-3): 135-168.
2Clare A, King R D. Knowledge Discovery in Multi-label Phenotype Data[C]//Proc. of the 5th European Conference on Principles of Data Mining and Knowledge Discovery. Berlin, Germany: Springer, 2001.
3Zhang Minling. ML-RBF: RBF Neural Networks for Multi-labelLearning[J]. Neural Process Letters, 2009, 29(2): 61-74.
4Elisseeff A, Weston J. A Kernel Method for Multi-labelled Classification[EB/OL]. (2010-11-21). http://www.citeulike.org/ group/4310/article/3482988.
5段震,程家兴,张铃.基于覆盖的多标记学习方法研究[J].计算机工程与应用,2010,46(14):20-23. 被引量：1
6Zhang Minling, Zhou Zhihua. ML-kNN: A Lazy Learning Approach to Multi-label Learning[J]. Pattern Recognition, 2007, 40(7): 2038-2048.
7张铃,张钹.问题求解理论及应用--商空间粒度计算理论及应用[M].2版.北京:清华大学出版社,2007.
8Tsoumakas C~ Katakis I. Multi-label Classification: An Overview[J]. Intemational Journal of Data Warehousing and Mining, 2007, 3(3): 1-3.

二级参考文献18

1张燕平,张铃,吴涛,徐锋,张,王伦文.基于覆盖的构造性学习算法SLA及在股票预测中的应用[J].计算机研究与发展,2004,41(6):979-984. 被引量：18
2张燕平,张铃,段震.构造性核覆盖算法在图像识别中的应用[J].中国图象图形学报（A辑）,2004,9(11):1304-1308. 被引量：17
3张燕平,张铃,吴涛.机器学习中的多侧面递进算法MIDA[J].电子学报,2005,33(2):327-331. 被引量：26
4吴涛,张铃,张燕平.机器学习中的核覆盖算法[J].计算机学报,2005,28(8):1295-1301. 被引量：33
5何清,史忠植.基于覆盖的分类算法研究进展[J].计算机学报,2007,30(8):1235-1243. 被引量：3
6Kazawa H,Izumitani T,Taira H,et al.Maximal margin labeling for multi-topic text categorization[C]//Proccedings of Advances in Neural Information Processing Systems.Canada:Vancouver,2003,16:647-656.
7Boutell M R,Luo J,Sheu X,et al.Learaing multi-label scene classification[J].Pattem Recognition,2004,37(9):1757-1771.
8Diplaris S,Tscumakas G,Mitkas P,et al.Protein classification with multiple algorithms[C]//Proceedings of the 10th Panhellenie Conference on Informaties(PCI 2005).Greece:Springer,2005:448-456.
9Zhang M L,Zhou Z H.Multi-label neural networks with applications to functional genomics and text categorization[J].lEEE Transactions on Knowledge and Data Engineering,2006,18(10):1338-1351.
10Godbole S,Sarowagi S.Discriminative methods for multi-labeled classifieation[C]//Proceedings of the 8th Pacific-Asia Conference on Knowledge Discovery and Data Mining(PAKDD 2004),2004:22-30.

共引文献1

1苟光磊,黄丽丰,倪伟.基于粒计算的概念聚类算法[J].重庆理工大学学报（自然科学）,2013,27(6):76-79. 被引量：3

同被引文献32

1罗永军,王长松,曹建国,金丽娜,姚耕耘.兼顾板形的热连轧机负荷分配的优化[J].北京科技大学学报,2005,27(1):94-97. 被引量：5
2TSOUMAKAS G, KATAKIS I. Muhi-label classification: an over- view[ J]. Database Technologies Concepts Methodologies Tools and Applications, 2007,2007(3): 1 -13.
3BOUTELL M R, LOU J, SHEN X, et al. Learning multi-label scene classification[ J]. Pattern Recognition, 2004, 37(9) : 1757 - 1771.
4HUANG S-J, ZHOU Z-H. Multi-tabel teaming by exploiting label correlations locally[ C]// AAAI 2012: Proceedings of the 26th AAAI Conference on Artificial Intelligence. Menlo Park: AAAI Press, 2012:949 -955.
5ZHANG M, ZHANG K. Multi-label learning by exploiting label de- pendency[ C]//KDD 2010: Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2010:999 - 1008.
6ZHANG M, ZHOU Z. Multi-label neural networks with applications to functional genomics and text categorization [ J]. IEEE Transac- tions on Knowledge and Data Engineering, 2006, 18(10) : 1338 -1351.
7SCHAPIRE R E, SINGER Y. BoosTexter: a boosting-based system for text categorization[ J]. Machine Learning, 2000, 39(2/3) : 135 - 168.
8ZHANG M-L, ZHOU Z-H. ML-KNN: a lazy learning approach to multi-label learning[J]. Pattern Recognition, 2007, 40(7) :2038 - 2048.
9TSOUMAKAS G, VLAHAVAS I. Random k-Labelsets: an ensem- ble method for multi-label classification [ C]// ECML 2007: Pro- ceedings of the 18th European Conference on Machine Learning, LNCS 4701, Berlin: Springer-Verlag, 2007:406 -417.
10READ J, PFAHRINGER B, HOLMES G, et al. Classifier chains for multi-label classification[ C]//ECML PKDD 2009: Proceedings of the 2009 European Conference on Machine Learning and Knowl- edge Discovery in Databases, LNCS 5782. Berlin: Springer-Verlag, 2009:254-269.

引证文献4

1檀何凤,刘政怡.基于标签相关性的K近邻多标签分类方法[J].计算机应用,2015,35(10):2761-2765. 被引量：11
2刘卓然,胡杨,刘骊,冯旭鹏,刘利军,黄青松.基于标签相似度的不良信息多标签分类方法[J].计算机应用研究,2016,33(4):989-992. 被引量：8
3潘主强,张林,张磊,李国正,颜仕星.中医临床疾病数据多标记分类方法研究[J].计算机科学与探索,2018,12(8):1295-1304. 被引量：1
4丁敬国,宋梦雪,张志鸿,郝学斌,任连波,魏子超.改进快速非支配排序遗传算法热连轧过程负荷分配的智能优化[J].材料与冶金学报,2022,21(3):228-234. 被引量：3

二级引证文献22

1樊强.大数据环境下安全信息优化保护仿真[J].计算机仿真,2018,35(6):176-179. 被引量：4
2瞿合祚,李晓明,陈陈,何乐.基于卷积神经网络的电能质量扰动分类[J].武汉大学学报（工学版）,2018,51(6):534-539. 被引量：31
3宁琳,孙艳红.多媒体网络不良信息过滤方法仿真[J].计算机仿真,2018,35(7):343-346. 被引量：1
4宋才华,陈春梅,邓乾.供电企业存量客户用电地址数据结构化与规范化的清理方法研究[J].微型电脑应用,2018,34(10):78-80. 被引量：2
5韩栋,王春华,肖敏.结合旋转森林和Ada Boost分类器的多标签文本分类方法[J].计算机应用研究,2018,35(12):3655-3658. 被引量：10
6姚哲,陶剑文.多源适应多标签分类框架[J].计算机工程与应用,2017,53(7):88-96. 被引量：24
7李兆玉,王纪超,雷曼,龚琴.基于引力模型的多标签分类算法[J].计算机应用,2018,38(10):2807-2811. 被引量：7
8陆凯,徐华.ML-kNN算法在大数据集上的高效应用[J].计算机工程与应用,2019,55(1):84-88. 被引量：5
9吕庆莉.基于信息增益的中医体质多标记分类方法研究[J].中国中医药信息杂志,2019,26(6):97-100.
10王健.文档数据库结构信息分类筛查方法仿真[J].计算机仿真,2019,36(5):417-420. 被引量：3

1赵海峰,余强,曹俞旦.基于粒计算的多标签懒惰学习算法[J].计算机科学,2014,41(12):160-163. 被引量：2
2王吉源,黎晨,王婵娟.用户属性加权活跃近邻的协同过滤算法[J].计算机应用研究,2016,33(12):3625-3629. 被引量：6
3赵庆.空中目标的识别——一种基于局域库搜索的识别方法[J].机器人,1993,15(4):52-52.
4任雪利.协同过滤在软件成本估算中的应用[J].计算机系统应用,2014,23(6):246-249. 被引量：1
5胡翰.基于主动学习的半监督聚类入侵检测算法[J].无线互联科技,2011,8(10):27-28.
6李代平,罗寿文,张信一,方海翔.网格并行任务划分策略研究[J].计算机应用研究,2005,22(10):80-82. 被引量：1
7郑宇华,屠红蕾,谢立,孙钟秀.一个逻辑程序并行执行的粒度控制模型[J].软件学报,1995,6(11):655-664.
8苗园,王加俊,刘守快.基于图片序列的三维表面重建[J].数据采集与处理,2011,26(4):407-412. 被引量：1
9贺怀清,范志亮,刘浩翰.基于网络社区划分的协同推荐算法[J].中国民航大学学报,2016,34(5):40-44. 被引量：1
10李永忠,胡翰.基于主动学习的半监督聚类入侵检测算法[J].江苏科技大学学报（自然科学版）,2010,24(2):160-163. 被引量：3

计算机工程

2012年第22期

浏览历史

内容加载中请稍等...

基于粒计算的K近邻多标签学习算法被引量：4

参考文献8

二级参考文献18

共引文献1

同被引文献32

引证文献4

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于粒计算的K近邻多标签学习算法 被引量：4

参考文献8

二级参考文献18

共引文献1

同被引文献32

引证文献4

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于粒计算的K近邻多标签学习算法被引量：4