基于种子节点选择的网络环境下多标签分类算法研究被引量：3

Multi-label Classification in Network Environments via Seed Node Selection

下载PDF

导出

摘要多标签分类在基因分类,药物发现和文本分类等实际问题中有着广泛的应用.已存在的多标签分类算法,通常都是从网络中随机的选取节点作为训练集.然而,在分类算法执行的过程中,网络中不同节点所起的作用不同.在给定训练集数目的情况下,选择的训练集不同,分类精度也会不同.所以我们引入了种子节点的概念,标签分类从种子节点开始,经过不断推理,得到网络中其他所有节点的标签.本文提出了SHDA(Nodes Selection of High Degree from Each Affiliation)算法,即从网络的每个社团中,按比例的选取度数较大的节点,然后将其合并,处理后得到种子节点.真实数据集上的实验表明,将种子节点用作训练集进行多标签分类,能够提升网络环境下多标签分类的准确率. Multi-label classification is widely used in genetic classification,drug discovery and text classification. The existing multi-label classification algorithms usually select nodes randomly from the network as their training set. However,during multi-label classification,different nodes have different effects. Given the number of nodes in the training set,a different training sub-set can lead to different classification accuracy. Hence,we introduce the concept of seed nodes,the classification procedure starts from the seed nodes,and after continuous reasoning,the labels of other nodes are inferred in the network. We propose an SHDA algorithm（ Nodes Selection of High Degree from Each Affiliation） in which the nodes of high degrees from each affiliation belonging to the network are selected and merged,and after processing,the seed nodes are obtained. Experiments on several real-world datasets demonstrate that taking seed nodes as the training set to classify multi-labeled data can improve the classification performance.

作者吴信东赵银凤李磊

机构地区合肥工业大学计算机与信息学院佛蒙特大学计算机科学系

出处《电子学报》 EI CAS CSCD 北大核心 2016年第9期2074-2080,共7页 Acta Electronica Sinica

基金国家重点基础研究发展规划(973计划)项目(No.2013CB329604) 教育部创新团队(No.IRT13059) 国家自然科学基金项目(No.61229301 No.61503114)

关键词多标签分类网络种子节点推理社团 multi-label classification network seed nodes

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1郑伟,王朝坤,刘璋,王建民.一种基于随机游走模型的多标签分类算法[J].计算机学报,2010,33(8):1418-1426. 被引量：57

二级参考文献24

1Shen X,Boutell M,Luo J,Brown C.Multi-label machine learning and its application to semantic scene classification//Proceedings of the 2004 International Symposium on Electronic Imaging.San Jose,California,USA,2004:18-22.
2Hullermeier E,Furnkranz J,Cheng W,Brinker K.Label ranking by learning pairwise preferences.Artificial Intelligence,2008,172(16):1897-1916.
3Read J.A pruned problem transformation method for multi-label classification//Proceedings of the New Zealand Computer Science Research Student Conference.New Zealand,2008:143-150.
4Tsoumakas G,Vlahavas I.Random k-labelsets:An ensemble method for multilabel classification//Proceedings of the ECML.Warsaw,Poland,2007:406-417.
5Schapire R,Singer Y.BoosTexter:A boosting-based system for text categorization.Machine Learning,2000,39(2):135-168.
6Zhang M,Zhou Z.Multilabel neural networks with applications to functional genomics and text categorization.IEEE Transactions on Knowledge and Data Engineering,2006,18(10):1338-1351.
7Zhang M,Zhou Z.A k-nearest neighbor based algorithm for multi-label classification//Proceedings of the IEEE International Conference on Granular Computing.Beijing,China,2005,2:718-721.
8Clare A,King R.Knowledge discovery in multi-label phenotype data//Proceedings of the ECML/KDD.Freiburg,Germany,2001:42-53.
9Tsoumakas G,Dimou A,Spyromitros E,Mezaris V,Kompatsiaris I,Vlahavas I.Correlation-based pruning of stacked binary relevance models for multi-label learning//Proceedings of the ECML/PKDD.Slovenia,2009:101.
10Page L,Brin S,Motwani R,Winograd T.The pagerank citation ranking:Bringing order to the web//Proceedings of the ASIS.Orlando,FL,1998:161-172.

共引文献56

1喻金平,郑杰,朱桂祥.基于多关系网络的社区检测算法[J].系统仿真学报,2015,27(1):147-154. 被引量：1
2孙伟平,向杰,陈加忠,余胜生.基于GPU的粒子滤波并行算法[J].华中科技大学学报（自然科学版）,2011,39(5):63-66. 被引量：11
3赵卫红.海洋中胶体研究的新进展[J].海洋与湖沼,2000,31(2):221-229. 被引量：11
4蒋华,戚玉顺.基于球结构支持向量机的多标签分类的主动学习[J].计算机应用,2012,32(5):1359-1361. 被引量：3
5任梅,詹永照,潘道远,孙佳瑶.基于概率超图的视频事件语义检测[J].计算机应用,2012,32(11):3014-3017. 被引量：1
6蒋华,戚玉顺.基于球结构SVM的多标签分类[J].计算机工程,2013,39(1):294-297. 被引量：6
7范海雄,刘付显,夏璐.基于概率LS-SVM的多标签非均衡样本分类算法[J].解放军理工大学学报（自然科学版）,2013,14(2):169-175.
8李思男,李宁,李战怀.多标签数据挖掘技术:研究综述[J].计算机科学,2013,40(4):14-21. 被引量：31
9张振海,李士宁,李志刚,陈昊.一类基于信息熵的多标签特征选择算法[J].计算机研究与发展,2013,50(6):1177-1184. 被引量：62
10林霄,肖国强,吴松,邱开金.基于随机游走模型的物体识别[J].计算机工程与应用,2013,49(21):145-151.

同被引文献12

1郑伟,王朝坤,刘璋,王建民.一种基于随机游走模型的多标签分类算法[J].计算机学报,2010,33(8):1418-1426. 被引量：57
2张振海,李士宁,李志刚,陈昊.一类基于信息熵的多标签特征选择算法[J].计算机研究与发展,2013,50(6):1177-1184. 被引量：62
3刘晓娟,闫海兰.基于NSGA2算法的并行机多目标调度问题研究[J].物联网技术,2013,3(10):44-45. 被引量：3
4孙建龙,吴锁平,陈燕超.基于改进NSGA2算法的配电网分布式电源优化配置[J].电力建设,2014,35(2):86-90. 被引量：16
5陈季梦,陈佳俊,刘杰,黄亚楼,王嫄,冯霞.基于结构相似度的大规模社交网络聚类算法[J].电子与信息学报,2015,37(2):449-454. 被引量：15
6邢千里,刘列,刘奕群,张敏,马少平.微博中用户标签的研究[J].软件学报,2015,26(7):1626-1637. 被引量：34
7刘世超,朱福喜,甘琳.基于标签传播概率的重叠社区发现算法[J].计算机学报,2016,39(4):717-729. 被引量：59
8许宇光,潘惊治,谢惠扬.基于最小点覆盖和反馈点集的社交网络影响最大化算法[J].电子与信息学报,2016,38(4):795-802. 被引量：7
9刘军煜,贾修一.一种利用关联规则挖掘的多标记分类算法[J].软件学报,2017,28(11):2865-2878. 被引量：34
10程玉胜,赵大卫,王一宾,裴根生.非平衡化标签补全核极限学习机多标签学习[J].电子学报,2019,47(3):719-725. 被引量：3

引证文献3

1李磊,楚喻棋,汪萌,韩莉,吴信东.基于NSGA2的网络环境下多标签种子节点选择[J].电子与信息学报,2017,39(9):2040-2047. 被引量：1
2LYU Fan,LI Linyan,Victor S.Sheng,FU Qiming,HU Fuyuan.Multi-label Image Classification via Coarse-to-Fine Attention[J].Chinese Journal of Electronics,2019,28(6):1118-1126. 被引量：4
3朱赛赛,贾修一,李泽超.一种基于全局和局部标记相关性的多标记分类算法[J].电子学报,2020,48(12):2345-2351. 被引量：3

二级引证文献8

1王春明,朱永利.基于NSGA2优化正则极限学习机的变压器油色谱故障诊断[J].高压电器,2020,56(9):210-215. 被引量：21
2WANG Lele,WANG Binqiang,ZHAO Peipei,LIU Ruyi,LIU Jiangang,MIAO Qiguang.Malware Detection Algorithm Based on the Attention Mechanism and ResNet[J].Chinese Journal of Electronics,2020,29(6):1054-1060. 被引量：5
3马致颖,赵佰亭,冯铸,张华.卷积神经网络与ELM的图像分类算法研究[J].哈尔滨商业大学学报（自然科学版）,2021,37(4):415-421. 被引量：2
4ZHANG Zhe,WANG Bilin,YU Zhezhou,LI Zhiyuan.Dilated Convolutional Pixels Affinity Network for Weakly Supervised Semantic Segmentation[J].Chinese Journal of Electronics,2021,30(6):1120-1130. 被引量：1
5LIN Jingjing,YE Zhonglin,ZHAO Haixing,FANG Lusheng.DeepHGNN:A Novel Deep Hypergraph Neural Network[J].Chinese Journal of Electronics,2022,31(5):958-968. 被引量：2
6袁志祥,王雅卿,黄俊.基于深度互学习的多标记零样本分类[J].计算机工程,2023,49(10):64-71.
7郑黎明.基于模糊聚类算法的电子档案分类管理系统[J].兵工自动化,2024,43(7):27-30.
8张雨舒,陈琳琳,何强.基于全局和局部目标点相关性的多标签学习[J].图像与信号处理,2024,13(3):348-357.

1胡湘萍.C#中接口与抽象类的应用辨析[J].科协论坛（下半月）,2010(2):62-63. 被引量：1
2方春城,王昌胜.基于MATLAB的系统稳态误差分析[J].广西轻工业,2008,24(6):73-74. 被引量：2
3谭骏,陈兴蜀,杜敏.基于特征加权与最近邻法的P2P协议识别算法[J].四川大学学报（工程科学版）,2011,43(4):116-123. 被引量：1
4张文举,陈曙东,刘了,马范援,沈建华.药物发现网格设计与实现[J].计算机工程,2006,32(11):259-261. 被引量：2
5冬至（编译）.浏览药物发现数据[J].生物技术世界,2008(1):45-47.
6段震,程家兴,张铃.基于覆盖的多标记学习方法研究[J].计算机工程与应用,2010,46(14):20-23. 被引量：1
7王立忠.采矿工程方法优化研究[J].科技与企业,2013(16):214-214. 被引量：1
8李玲.基于复杂网络理论的计算机网络拓扑研究[J].电子技术与软件工程,2014(6):31-31. 被引量：1
9刘庆运.破拆救援机器人关键技术[J].现代制造工程,2009(7):149-153. 被引量：14
10王海军,聂雅琳.显现模式:一种基因分类的工具[J].计算机与现代化,2008(9):134-136. 被引量：1

电子学报

2016年第9期

浏览历史

内容加载中请稍等...

基于种子节点选择的网络环境下多标签分类算法研究被引量：3

参考文献1

二级参考文献24

共引文献56

同被引文献12

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于种子节点选择的网络环境下多标签分类算法研究 被引量：3

参考文献1

二级参考文献24

共引文献56

同被引文献12

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于种子节点选择的网络环境下多标签分类算法研究被引量：3