基于自编码器及超图学习的多标签特征提取被引量：13

Multi-label Feature Selection with Autoencoders and Hypergraph Learning

下载PDF

导出

摘要在实际应用场景中越来越多的数据具有多标签的特性,且特征维度较高,包含大量冗余信息.为提高多标签数据挖掘的效率,多标签特征提取已经成为当前研究的热点.本文采用去噪自编码器获取多标签数据特征空间的鲁棒表达,在此基础上结合超图学习理论,融合多个标签对样本间几何关系的影响以提升特征提取的性能,构建多标签数据样本间几何关系所对应超图的Laplacian矩阵,并通过Laplacian矩阵的特征值分解得到低维投影空间.实验结果证明了本文所提出的算法在分类性能上是有效可行的. In practical application scenarios, more and more data tend to be assigned with multiple labels and contain much redundant information in the high dimensional feature space. To improve the efficiency and effectiveness of multi-label data mining, multi-label data feature selection has become a hotspot. This paper utilizes denoising autoencoders to obtain a more robust version of multi-label data feature representation. Furthermore, based on hypergraph learning theory, a hypergraph Laplacian matrix corresponding to multi-label data is constructed by fusing the effects of all labels on geometrical relationship among all the samples, and then a projection space with lower dimension is obtained by conducting eigenvalue decomposition of the Laplacian matrix. Experimental results demonstrate the effectiveness and feasibility of the proposed algorithm according to its multi-label data classification performance.

作者唐朝辉朱清新洪朝群祝峰

机构地区电子科技大学信息与软件工程学院厦门理工学院计算机与信息工程学院闽南师范大学粒计算实验室

出处《自动化学报》 EI CSCD 北大核心 2016年第7期1014-1021,共8页 Acta Automatica Sinica

基金国家自然科学基金(61300192 61472110 61573297 61379049) 中央高校基本科研项目(ZYGX2014J052) 福建省自然科学基金(2014J01256 2015J01277)资助~~

关键词深度学习自编码器多标签超图特征提取 Deep learning, autoencoders, multi-label, hypergraph, feature selection

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献28

1Zhang Y, Zhou Z H. Multi-label dimensionality reduction via dependence maximization. In:Proceedings of the 23rd AAAI Conference on Artificial Intelligence. Chicago, USA:AAAI Press, 2008. 1503-1505.
2付忠良.多标签代价敏感分类集成学习算法[J].自动化学报,2014,40(6):1075-1085. 被引量：23
3张晨光,张燕,张夏欢.最大规范化依赖性多标记半监督学习方法[J].自动化学报,2015,41(9):1577-1588. 被引量：4
4Zhang M L, Zhang K. Multi-label learning by exploiting label dependency. In:Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. Washington, USA:ACM, 2010. 999-1008.
5Hariharan B, Zelnik-Manor L, Vishwanathan S V N, Varma M. Large scale max-margin multi-label classification with priors. In:Proceedings of the 27th International Conference on Machine Learning. Haifa, Israel:Omnipress, 2010. 423-430.
6Elisseeff A, Weston J. A kernel method for multi-labelled classification. In:Proleedings of the 2001 Advances in Neural Information Processing Systems 14. British Columbia, Canada:MIT Press, 2001. 681-687.
7Sun L, Ji S W, Ye J P. Hypergraph spectral learning for multi-label classification. In:Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Las Vegas, USA:ACM, 2008. 668-676.
8Zhang M L, Zhou Z H. A review on multi-label learning algorithms. IEEE Transactions on Knowledge and Data Engineering, 2014, 26(8):1819-1837.
9Gibaja E, Ventura S. A tutorial on multi-label learning. ACM Computing Surveys, 2015, 47(3):Article No. 52.
10田枫,沈旭昆.基于标签集相关性学习的大规模网络图像在线标注[J].自动化学报,2014,40(8):1635-1643. 被引量：6

二级参考文献82

1凌晓峰,SHENG Victor S..代价敏感分类器的比较研究(英文)[J].计算机学报,2007,30(8):1203-1212. 被引量：35
2Tsoumakas G, Katakis I, Vlahavas I. Data Mining and Knowledge Discovery Handbook [M]. Berlin: Springer, 2010:667-685.
3Zhang Y, Zhou Z H. Multi label dimensionality reduction via dependence maximization [C] // Proe of the 2Srd AAAI Conf on Artificial Intelligence and the 20th Innovative Applications of Artificial Intelligence Conference. Menlo Park~ American Association for Artificial Intelligence, 2008: 150:3-1505.
4Li G Z, You M, Ge L, et al. Feature selection for semi- supervised multi label learning with application to gene function analysis [C] // Proc of the 2010 ACM Int Conf on Bioinformatics and Computational Biology. New York: Association for Computing Machinery, 2010:354-357.
5You M Y, Liu J M, Li G Z, et al. Embedded feature selection for multi-label classification of music emotions [J]. International Journal of Computational Intelligence Systems, 2012, 5(4): 668-678.
6Shao H. H G. l.iu G, et al. lahel data of inquiry diagnosis Symptom selection for multi n traditional Chinese medicioe [J]. Science China Information Sciences, 2012, 54(1): 1-13.
7Lee J, I.im H, Kim D W. Approximating mutual information for multi label feature selection [J].Electronics Le'tters, 2012, 48(15): 929-930.
8Zhang M I., Pena J M, Rohles V. Feature selection for muhi-lahel naive Bayes classification [J].Information Seienees, 2009, 179( 19): 3218-3229.
9Park C H, Lee M.On applying linear discriminant analysis for multi-labeled problems [J]. Pattern Recognition I.etters, 2008, 29(7) : 878-887.
10Yu K. Yu S, Tresp V. Multi label informed latent semantic indexing[C]/ Proc of the 28th Annual Int ACM SIGIR Conf on Research and Development in Information Retrieval. New York: ACM, 2005:258-265.

共引文献190

1王若明.浅谈代价敏感学习[J].网络安全技术与应用,2020(3):52-54.
2李敏,章国豪,陈梓樑,郭志勇,胡晓敏.基于差分进化的多目标粒子群特征选择算法[J].计算机应用研究,2020,37(1):76-79. 被引量：8
3杨明生,张春光,杨晓东.醒脑通腑液治疗急性期脑出血30例观察[J].实用中医药杂志,2000,16(2):6-6.
4吴建升.全方位培养中学生的语文兴趣[J].石油教育,2000(6):53-55.
5成卫青,唐旋.一种基于改进互信息和信息熵的文本特征选择方法[J].南京邮电大学学报（自然科学版）,2013,33(5):63-68. 被引量：14
6叶玲,彭皓月,高怡,吴咏梅,蒙明波,肖洋洋.基于客户能量使用大数据的能效评价体系构建[J].电力大数据,2019,22(1):41-47. 被引量：5
7潘果.基于正则化互信息改进输入特征选择的分类算法[J].计算机工程与应用,2014,50(15):25-29. 被引量：3
8张振尧,白瑞林,过志强,姜利杰.磁瓦表面缺陷的机器视觉检测方法[J].光学技术,2014,40(5):434-439. 被引量：8
9石慧,贾代平,苗培.基于词频信息的改进信息增益文本特征选择算法[J].计算机应用,2014,34(11):3279-3282. 被引量：16
10李新,张振尧,白瑞林.轴承圆柱滚子表面缺陷的视觉检测方法[J].自动化仪表,2014,35(12):58-62. 被引量：4

同被引文献78

1戚湧,胡俊,於东军.基于自组织映射与概率神经网络的增量式学习算法[J].南京理工大学学报,2013,37(1):1-6. 被引量：7
2丁绪星,朱日宏,李建欣.一种静止图像质量评价指标[J].南京理工大学学报,2004,28(5):507-510. 被引量：8
3吴晓婷,闫德勤.数据降维方法分析与研究[J].计算机应用研究,2009,26(8):2832-2835. 被引量：73
4张宏达,王晓丹,徐海龙.一种LDA与SVM混合的多类分类方法[J].控制与决策,2009,24(11):1723-1728. 被引量：3
5高宇.基于SOM神经网络的风电电子装置故障诊断[J].电力系统及其自动化学报,2010,22(3):142-145. 被引量：16
6张煜东,霍元铠,吴乐南,董正超.降维技术与方法综述[J].四川兵工学报,2010,31(10):1-7. 被引量：29
7闫德勤,刘胜蓝,李燕燕.一种基于稀疏嵌入分析的降维方法[J].自动化学报,2011,37(11):1306-1312. 被引量：21
8胡友涛,胡昌华,孔祥玉,周志杰.基于WSVR和FCM聚类的实时寿命预测方法[J].自动化学报,2012,38(3):331-340. 被引量：16
9张敏灵.一种新型多标记懒惰学习算法[J].计算机研究与发展,2012,49(11):2271-2282. 被引量：39
10李昕,李立君.一种偏好多目标蜂群算法及其在油茶果图像识别中的应用[J].计算机应用研究,2012,29(12):4779-4781. 被引量：4

引证文献13

1谢国,张永艳,上官安琪,杜许龙,黑新宏,高橋聖,望月寛.列车轴温监测数据软测量方法[J].交通运输工程学报,2018,18(6):101-111. 被引量：1
2张绍辉.集成参数自适应调整及隐含层降噪的深层RBM算法[J].自动化学报,2017,43(5):855-865. 被引量：7
3许卓斌,郑海山,潘竹虹.基于改进自编码器的文本分类算法[J].计算机科学,2018,45(6):208-210. 被引量：5
4蒋宗礼,张津丽,杜永萍,王光亮.基于堆叠降噪自编码器的异质网络的层次构建与节点分类[J].北京工业大学学报,2018,44(9):1217-1226. 被引量：3
5冯玉伯,丁承君,陈雪.滚动轴承故障检测深度卷积稀疏自动编码器建模研究[J].机械科学与技术,2018,37(10):1566-1572. 被引量：6
6陈耀,宋晓宁,於东军.迭代化代价函数及超参数可变的生成对抗网络[J].南京理工大学学报,2019,43(1):35-40. 被引量：3
7张习之,李立君.基于改进卷积自编码机的油茶果图像识别研究[J].林业工程学报,2019,4(3):118-124. 被引量：15
8刘慧婷,冷新杨,王利利,赵鹏.联合嵌入式多标签分类算法[J].自动化学报,2019,45(10):1969-1982. 被引量：15
9王一宾,李田力,程玉胜,钱坤.基于核极限学习机自编码器的标记分布学习[J].山东大学学报（工学版）,2020,50(3):58-65. 被引量：2
10张国芳,刘通宇,温丽丽,郭果,周忠新,袁培森.基于变分自编码器的日线损率异常检测研究[J].华东师范大学学报（自然科学版）,2020(5):146-155. 被引量：14

二级引证文献75

1李川,张绍辉,José Valentede Oliveira.基于次优网络深度学习的3D打印机故障诊断[J].机械工程学报,2019,55(7):73-80. 被引量：6
2唐立新.基于BIM的装配式建筑施工进度自适应调整方法[J].电脑知识与技术,2019,15(4X):271-273.
3秦晓风,夏斌,袁文浩,张立晔.基于深度置信网络的超宽带信道环境的分类算法[J].科学技术与工程,2019,19(20):237-240.
4黄宏涛,梁存良,李大鹏,叶海智.基于近似子图的规则空间压缩算法[J].自动化学报,2019,45(8):1586-1598. 被引量：2
5马丽华,朱春梅,赵西伟,覃绘桥.基于思维进化优化极限学习机的滚动轴承故障的智能诊断[J].制造技术与机床,2019,0(11):103-109. 被引量：3
6陈丽芳,冯力静,刘保相.神经网络规则优化建模与应用[J].计算机工程与科学,2019,41(12):2247-2254. 被引量：8
7蒋宗礼,陈浩强,张津丽.基于融合元路径权重的异质网络表征学习[J].计算机系统应用,2019,28(12):28-36. 被引量：2
8罗有志,陈征明,陈明,梅文涛.一种基于自适应关联熵的关键字提取算法[J].计算机与现代化,2020,0(4):67-71. 被引量：1
9赵华楠.基于傅里叶变换的机械设备振动故障信息检测系统设计[J].科技资讯,2020,18(8):36-37. 被引量：3
10蒋宗礼,李苗苗,张津丽.基于融合元路径图卷积的异质网络表示学习[J].计算机科学,2020,47(7):231-235. 被引量：4

1施培蓓,郭玉堂,胡玉娟,俞骏.多尺度的谱聚类算法[J].计算机工程与应用,2011,47(8):128-130. 被引量：4
2梁栋,童强,王年,鲍文霞,屈磊.一种基于Laplacian矩阵的图像匹配算法[J].计算机工程与应用,2005,41(36):31-32. 被引量：4
3张智,傅忠谦,严钢.Synchronization speed of identical oscillators on community networks[J].Chinese Physics B,2009,18(6):2209-2212. 被引量：1
4彭静,廖乐健,翟英,仇晶.谱聚类在社团发现中的应用[J].北京理工大学学报,2016,36(7):701-705. 被引量：1
5廖建平,王卫民.基于新直觉模糊相似度量的直觉模糊谱聚类算法[J].科技通报,2015,31(4):222-226. 被引量：2
6马腾,龙翔,冯路,骆沛,吴壮志.点云模型的谱聚类分割[J].计算机辅助设计与图形学学报,2012,24(12):1549-1558. 被引量：14
7王俊生,王年,郭秀丽,唐俊.基于Normalized Cut的基因表达数据聚类[J].安徽大学学报（自然科学版）,2012,36(4):68-72. 被引量：4
8阳伟,甘涛,兰刚.基于纹理聚类的抠图算法[J].计算机应用,2013,33(11):3213-3216.
9董瑞,梁栋,唐俊,鲍文霞,何韬.基于颜色梯度的图像特征点匹配算法[J].计算机工程,2007,33(16):178-180. 被引量：4
10门朝光,曹刘娟,孙建国.图谱域的矢量地图可逆水印算法[J].哈尔滨工业大学学报,2009,41(12):83-87. 被引量：3

自动化学报

2016年第7期

浏览历史

内容加载中请稍等...

基于自编码器及超图学习的多标签特征提取被引量：13

参考文献28

二级参考文献82

共引文献190

同被引文献78

引证文献13

二级引证文献75

相关作者

相关机构

相关主题

浏览历史

基于自编码器及超图学习的多标签特征提取 被引量：13

参考文献28

二级参考文献82

共引文献190

同被引文献78

引证文献13

二级引证文献75

相关作者

相关机构

相关主题

浏览历史

基于自编码器及超图学习的多标签特征提取被引量：13