基于多视角学习和注意力的特征选择算法被引量：2

Feature selection algorithm based on multi-view learning and attention

下载PDF

导出

摘要从海量且包含噪声的数据中挑选出关键性的特征,即特征选择,一直是机器学习任务中的重要挑战.鉴于此,提出了基于多视角表征学习和注意力机制的特征选择方法.首先,该算法通过多实例生成器为每个样本生成实例包,同时采用特殊的填补方式来保证特征位置不变性.其次,多视角表征模块从多个视角挖掘特征的自身信息及交互信息,并利用注意力机制模块为这些表征计算贡献度权重,最后,分类网络利用权重化表征进行分类.实验结果表明:该模型可以为每个标签挑选出最具代表性的特征群,并在不同类型数据集上取得了性能提升. Feature selection plays an important role in many machine learning tasks,which is always a major challenge for selecting the key features from big and noisy data.Therefore,this paper proposes a feature selection method based on multi-view representation learning and attention mechanism.Firstly,Multi-instance generator of the algorithm generates instance bags for each sample,and uses a special padding method to ensure the invariance of feature positions.Then,the multi-view representation module mines the feature’s own information and interaction information from multiple perspectives.Next,the attention mechanism module calculates the contribution weights for these representations.Finally,the classification network uses the weighted representations for classification tasks.The experimental results show that the proposed method can select the most representative feature group for each label and improve the accuracy on different datasets with diverse types.

作者庞华鑫韦世奎马俊才赵玉凤赵耀 PANG Huaxin;WEI Shikui;MA Juncai;ZHAO Yufeng;ZHAO Yao(School of Computer and Information Technology,Beijing Jiaotong University,Beijing 100044,China)

机构地区北京交通大学计算机与信息技术学院

出处《北京交通大学学报》 CAS CSCD 北大核心 2020年第5期70-76,共7页 JOURNAL OF BEIJING JIAOTONG UNIVERSITY

基金国家重点研发计划(2017YFC1703503) 国家自然科学基金(61532005,61972022)。

关键词信号与信息处理注意力机制多视角表征特征选择 signal and information processing attention mechanism multi-view representation feature selection

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1谢娟英,谢维信.基于特征子集区分度与支持向量机的特征选择算法[J].计算机学报,2014,37(8):1704-1718. 被引量：64
2方匡南,吴见彬,朱建平,谢邦昌.随机森林方法研究综述[J].统计与信息论坛,2011,26(3):32-38. 被引量：679

二级参考文献65

1刘微,罗林开,王华珍.基于随机森林的基金重仓股预测[J].福州大学学报（自然科学版）,2008,36(S1):134-139. 被引量：8
2林成德,彭国兰.随机森林在企业信用评估指标体系确定中的应用[J].厦门大学学报（自然科学版）,2007,46(2):199-203. 被引量：37
3毛勇,周晓波,夏铮,尹征,孙优贤.特征选择算法研究综述[J].模式识别与人工智能,2007,20(2):211-218. 被引量：95
4Breiman L. Bagging Preditors [J].Machine Learning, 1996,24(2).
5Dietterich T. An Experimental Comparison of Three Methods for Constructing Ensembles of Decision Trees: Bagging, Boosting and Randomization [J].Machine Learning, 2000,40(2).
6Ho T K. The Random Subspace Method for Constructing Decision Forests [J].Trans. on Pattern Analysis and Machine Intelligence, 1998,20 (8).
7Amit Y, Gernan D. Shape Quantization and Recognition with Randomized Trees[J]. Neural Computation, 1997,9(7). Breiman L Random Forest[J]. Machine Learning, 2001,45(1).
8Breiman L. Random Forests[J]. Machine Learning, 2001,45(1).
9Tibshirani tL Bias, Variance, and Prediction Error for Classification Rules[C]. Technical Report, Statistics Department, University of Toronto, 1996.
10Wolpert D H, Macready W G. An Efficient Method to Estimate Bagging's Generalization Error[J]. Machine Learning, 1999,35(1).

共引文献741

1郑伟,戴伊宁,孙楠楠,尹乔乔,吴青青,惠田辰,吴文昊,黄海军,童永喜,黄益澄,汪明珊,陈美娟,张家杰,严蓉,高海女,潘红英.应用随机森林模型和Logistic回归模型分析COVID-19的影响因素[J].预防医学,2021,33(7):722-725. 被引量：1
2袁鸷慧,聂胜,张合兵,王成,王宏涛,习晓环.GEDI地面高程和森林冠层高度的精度评价与影响分析[J].遥感技术与应用,2022,37(5):1056-1070. 被引量：2
3李欣,俞卫琴.基于改进GS-XGBoost的个人信用评估[J].计算机系统应用,2020,29(11):145-150. 被引量：8
4谢春,许伟.基于随机森林回归算法的锅炉沾污因数预测方法[J].上海电气技术,2022,15(1):29-32. 被引量：1
5王仁超,朱品光.基于随机森林回归方法的爆破块度预测模型研究[J].水力发电学报,2020,39(1):89-101. 被引量：23
6杨龙,王闻娟,覃哲,古悦璇.中国大学生气候认知与低碳行为及其影响因素研究——基于随机森林模型分析[J].文化与传播,2022,11(2):6-15. 被引量：1
7盖超会,王成刚.基于改进布谷鸟算法与SVM的矿用变压器故障诊断[J].煤炭工程,2019,51(11):134-137. 被引量：6
8饶贵川,王雅楠,华伟平,林维晟,潘俊忠,廖佩莹.环境因子对人工森林蓄积量影响的机器学习分析[J].林业科技通讯,2023(12):58-63.
9李敏,章国豪,陈梓樑,郭志勇,胡晓敏.基于差分进化的多目标粒子群特征选择算法[J].计算机应用研究,2020,37(1):76-79. 被引量：8
10张文杰,蒋烈辉.一种基于遗传算法优化的大数据特征选择方法[J].计算机应用研究,2020,37(1):50-52. 被引量：21

同被引文献18

1华攸金,李希建.基于可拓理论的煤矿安全风险预警与评估[J].煤炭工程,2020,52(1):163-168. 被引量：9
2关联合.矿井重大危险源监测识别及预测预警系统开发[J].矿业安全与环保,2014,41(3):43-46. 被引量：6
3周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1726
4陆秋蓉,李慧,范旦,谢静,温川飙.基于深度学习技术的穴位热敏化客观化研究[J].亚太传统医药,2017,13(17):98-100. 被引量：5
5杨佳艺,赵成勇,苑宾,李探.基于粒子群优化算法的VSC-HVDC系统的控制参数优化策略[J].电力自动化设备,2017,37(12):178-183. 被引量：18
6李敬兆,宫华强.煤矿信息物理系统场景感知自配置与优化策略研究[J].煤炭科学技术,2019,47(4):20-25. 被引量：13
7袁亮,俞啸,丁恩杰,赵小虎,冯仕民,张达,刘统玉,王卫东,黄艳秋.矿山物联网人-机-环状态感知关键技术研究[J].通信学报,2020,41(2):1-12. 被引量：50
8李腾飞,李常友,李敬兆.煤矿信息全面感知与智慧决策系统[J].工矿自动化,2020,46(3):34-37. 被引量：9
9贺昕航,霍增辉.中医人工智能的伦理风险初探[J].中国卫生法制,2020,28(3):8-11. 被引量：6
10陈常晖.基于粗糙集融合最小二乘支持向量机的煤矿安全预警模型[J].中国矿业,2020,29(6):76-80. 被引量：4

引证文献2

1李敬兆,孟亦凡,王继伟.矿山多层级安全态势感知系统[J].工矿自动化,2020,46(12):1-6. 被引量：3
2马宁,郝秀霞,邢俊凤,谷慧茹.卷积神经网络模型在中医辨证论治中的应用现状[J].中国数字医学,2023,18(4):37-42.

二级引证文献3

1陈鹏,江欢,陈泳奇,梅梦雅,章俊伟.服务于公共安全风险态势感知的冬奥会信息资源体系研究[J].现代信息科技,2021,5(12):36-40.
2郭清杰,张伟.煤炭计质计量智能管控关键技术的研究与应用[J].煤炭加工与综合利用,2022(9):17-20.
3徐方廷,黄锐,王秉.三元空间融合视阈下的安全态势感知模型研究[J].中国安全生产科学技术,2022,18(11):5-11. 被引量：9

1戴蓉.基于面部生理特征和深度学习的表情识别方法[J].重庆理工大学学报（自然科学）,2020,34(6):146-153. 被引量：7
2林冰心,黄希庭,刘培朵,岳童.视时距知觉适应后效的空间选择性[J].心理科学,2020,43(2):309-315. 被引量：1
3刘小垒,罗宇恒,邵林,张小松,朱清新.对抗样本生成及攻防技术研究[J].计算机应用研究,2020,37(11):3201-3205. 被引量：3
4李占山,吕艾娜.基于新冗余度的特征选择方法[J].东北大学学报（自然科学版）,2020,41(11):1550-1556. 被引量：3
5卢健,马成贤,杨腾飞,周嫣然.Text-CRNN+attention架构下的多类别文本信息分类[J].计算机应用研究,2020,37(6):1693-1696. 被引量：12
6朱小栋,魏紫钰,颜礼蓉,曹文会.MOOC背景下信息安全原理课程的教学方法[J].电子商务,2020,21(11):82-84. 被引量：1
7康宁宁,李梓欣,李川,李英娜,王昕.基于频域分量法的多模型日最大负荷预测[J].控制工程,2020,27(10):1714-1719.
8马波,蔡伟东,赵大力.基于GAN样本生成技术的智能诊断方法[J].振动与冲击,2020,39(18):153-160. 被引量：13
9方格,任琦,王彬,周小文,李先涛.稳定性冠心病合并脂代谢异常的中医证候分布特征[J].北京中医药大学学报,2020(5):427-431. 被引量：6
10宋艳,殷俊.基于共享近邻的多视角谱聚类算法[J].计算机应用,2020,40(11):3211-3216. 被引量：2

北京交通大学学报

2020年第5期

浏览历史

内容加载中请稍等...

基于多视角学习和注意力的特征选择算法被引量：2

参考文献2

二级参考文献65

共引文献741

同被引文献18

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于多视角学习和注意力的特征选择算法 被引量：2

参考文献2

二级参考文献65

共引文献741

同被引文献18

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于多视角学习和注意力的特征选择算法被引量：2