基于深度森林的量表数据挖掘方法被引量：4

Deep forest based inventory data mining method

下载PDF

导出

摘要在数据挖掘领域中,量表是间接获取样本属性数据的重要工具。针对量表数据离散、稀疏、二值化的特点,导致其难以进行分析挖掘的问题。文中采用了基于深度森林的量表数据挖掘方法,实验分别对老年健康综合评估数据库中的两个量表进行对比分析。实验结果表明,在所选取的两个量表中,提取到的关键属性数量相比于原始量表属性数量分别下降了30%和40%,且比基线模型下降了16%和18%。同时,提出的方法可在保证分类性能基本不变的情况下,进一步降低提取到的关键属性数量。 In data mining,inventory is one of the important equipment for acquiring data.However,the crucial attribute analysis often fails on inventory data due to the discrete,sparse and binary charac teristics of inventory.In this paper,we propose a deep forest based inventory data mining method.The experiments are carried out on two inventory datasets from the elderly health comprehensive evaluating database.The results show that in the selected two datasets,the extracted crucial attributes are reduced by 30%and 40%respectively compared with the original ones.Moreover,the number of crucial attributes extracted by proposed model is reduced by 16%and 18%compared with baselines.Besides,it also indicates that the proposed model can further reduce the number of crucial attributes while maintaining the performance of classification.

作者佟彤罗森林潘丽敏张铁梅 TONG Tong;LUO Sen-lin;PAN Li-min;ZHANG Tie-mei(Information System&Security and Countermeasures Experiments Center,Beijing Institute of Technology,Beijing 100081,China;Key Laboratory of Geriatric Medicine of Ministry of Health,National Geriatric Center,Beijing Hospital,Beijing 100730,China)

机构地区北京理工大学信息系统及安全对抗实验中心北京医院国家老年中心卫生部老年医学重点实验室

出处《电子设计工程》 2020年第13期88-91,96,共5页 Electronic Design Engineering

关键词深度森林量表数据数据挖掘属性提取 deep forest inventory data data mining attribute extraction

分类号 TP274 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献9

1朱晓妤,严云洋,刘以安,高尚兵.基于深度森林模型的火焰检测[J].计算机工程,2018,44(7):264-270. 被引量：14
2薛参观,燕雪峰.基于改进深度森林算法的软件缺陷预测[J].计算机科学,2018,45(8):160-165. 被引量：24
3周曙东.大数据产业投入产出表构建及经济贡献测度方法研究[J].调研世界,2019,0(3):7-10. 被引量：5
4宫振华,王嘉宁,苏翀.一种加权的深度森林算法[J].计算机应用与软件,2019,36(2):274-278. 被引量：14
5陈吕鹏,殷林飞,余涛,王克英.基于深度森林算法的电力系统短期负荷预测[J].电力建设,2018,39(11):42-50. 被引量：29
6韩慧,王黎明,柴玉梅,刘箴.基于强化表征学习深度森林的文本情感分类[J].计算机科学,2019,46(7):172-179. 被引量：10
7萧锘,钟毅,史东林.基于居民健康档案与大数据挖掘技术的慢病控制模型设计[J].南昌大学学报（理科版）,2018,42(5):500-505. 被引量：3
8杨欣欣,李慧波,胡罡.一种基于不平衡类深度森林的异常行为检测算法[J].中国电子科学研究院学报,2019,0(9):935-942. 被引量：14
9汪文勇,刘川,赵强,沈晓明,丘晓彤.直接验证的封装式特征选择方法[J].电子科技大学学报,2016,45(4):607-615. 被引量：7

二级参考文献85

1康重庆,夏清,张伯明.电力系统负荷预测研究综述与发展方向的探讨[J].电力系统自动化,2004,28(17):1-11. 被引量：496
2贺铿.关于信息产业和信息产业投入产出表的编制方法[J].数量经济技术经济研究,1989(2):34-40. 被引量：22
3GUYON I, ELISSEEFF A. An introduction to variable and feature selection[J]. J Mach Learn Res, 2003, 3: 1157-1182.
4ABDI H, WILLIAMS. "Principal component analysis" Wiley interdisciplinary reviews[J]. Computational Statistics, 2010, 2: 433-459.
5KOHAVI R, JOHN G H. Wrappers for feature subset selection[J]. Artiflntell, 1997, 97: 273-324.
6JUHA R. Overfitting in making comparisons between variable selection method[J]. Journal of Machine Learning Research, 2003, 3: 1371-1382.
7LIU Yi, ZHENG Yuan. FS_SFS: a novel feature selection method for support vector machines[J]. Pattern Recognit, 2006, 39: 1333-1345.
8LIU Huan, SETIONO R. A probabilistic approach to feature selection: a filter solution[C]//Proceedings of the Thirteenth International Conference on Machine Learning. Bari: [s.n.], 1996, 319-327.
9CHEN W, CHANG X, WANG H, et al. Automatic word clustering for text categorization using global information [C]//Asia Information Retrieval Syrup. Beijing: Springer- Verlag, 2004, 1-11.
10XIONG M, FANG Z, ZHAO J. Biomarker identification by feature wrappers[J]. Genome Res, 2001, lh 1878-1187.

共引文献92

1张建宁.基于改进动态图算法的软件保护技术[J].科技通报,2021,37(8):56-60. 被引量：1
2程月华,江文建,杨浩,薛琪,廖鹤.基于深度森林的卫星ACS执行机构与传感器故障识别[J].航空学报,2020(S01):195-205. 被引量：13
3陈华光.AutoCAD的动画制作[J].电脑编程技巧与维护,2000(4):86-89. 被引量：1
4雷海锐,高秀峰,刘辉.基于机器学习的混合式特征选择算法[J].电子测量技术,2018,41(16):42-46. 被引量：7
5杨其睿.基于改进的DenseNet深度网络火灾图像识别算法[J].计算机应用与软件,2019,36(2):258-263. 被引量：14
6宫振华,王嘉宁,苏翀.一种加权的深度森林算法[J].计算机应用与软件,2019,36(2):274-278. 被引量：14
7杜小磊,陈志刚,张楠,许旭.基于压缩感知和深度小波网络的列车故障识别[J].计算机应用,2019,39(7):2175-2180. 被引量：2
8利照坚,江秀娟,朱铮涛,袁浩期.基于深度学习的子弹缺陷检测方法[J].组合机床与自动化加工技术,2019(9):102-106. 被引量：5
9石兴华,曹金璇,芦天亮.基于深度森林的安卓恶意软件行为分析与检测[J].软件,2019,40(10):1-5. 被引量：4
10郭莹莹,张磊,肖成,孙培旺.基于改进深度森林算法的风电机组故障诊断技术研究[J].可再生能源,2019,37(11):1720-1725. 被引量：10

同被引文献37

1亓静.多维数据模型在人力资源管理中的应用[J].中国管理信息化,2012,15(7):52-57. 被引量：1
2陈忱,胡薇薇,孙宇锋,祁邦彦.基于BP-AdaBoost的电子式电能表故障检测方法[J].电光与控制,2013,20(4):72-76. 被引量：11
3危阜胜,肖勇,陈锐民.故障诊断技术在计量自动化系统中的应用[J].电测与仪表,2013,50(8):93-97. 被引量：28
4范洁,陈霄,周玉.基于用电信息采集系统的电能计量装置异常智能分析方法研究[J].电测与仪表,2013,50(11):4-9. 被引量：55
5谭中明,谢坤,彭耀鹏.基于梯度提升决策树模型的P2P网贷借款人信用风险评测研究[J].软科学,2018,32(12):136-140. 被引量：17
6李智杰,李昌华,刘欣,张沛,王玉英.融合拓扑特征和领域特征的非精确图匹配算法[J].计算机应用与软件,2015,32(10):164-167. 被引量：3
7巫可,战荫伟,李鹰.融合用户属性的隐语义模型推荐算法[J].计算机工程,2016,42(12):171-175. 被引量：17
8李琳娜,江雪琴.推荐系统中的隐语义模型研究[J].情报工程,2016,2(4):30-39. 被引量：6
9西楠,李雨明,彭剑锋,马海刚.从信息化人力资源管理到大数据人力资源管理的演进——以腾讯为例[J].中国人力资源开发,2017,34(5):79-88. 被引量：60
10刘付成,张树瑜.人力资源决策支持系统中数据仓库平台的设计研究[J].微型电脑应用,2017,33(8):40-42. 被引量：9

引证文献4

1孙琛.基于人工智能的人力资源数据整合系统[J].自动化与仪器仪表,2021(9):161-164. 被引量：1
2王萧萧,王亭雯,马玉玲,范佳奕,崔超然.基于深度森林的P2P网贷借款人信用风险评估方法[J].计算机科学,2021,48(S02):429-434. 被引量：4
3杨学良,戚梦逸,丁宏,陶晓峰,刘涅煊.基于改进深度森林的用电信息采集故障诊断[J].电力信息与通信技术,2022,20(4):32-40. 被引量：4
4李智杰,伊志林,李昌华,张颉.应用于非精确图匹配的改进DF模型[J].计算机科学与探索,2022,16(6):1383-1389. 被引量：1

二级引证文献10

1麦章渠,曾颖,张禄亮,李晨涛,季天瑶,尚筱雅.基于改进哈里斯鹰优化算法的有源配电网故障定位[J].智慧电力,2022,50(11):104-111. 被引量：9
2于晨晖,王浩名,李一,李红运,刘亚魁.基于深度森林的高压断路器弹簧机构状态识别[J].高压电器,2023,59(2):37-43. 被引量：1
3潘亚康.基于机器学习的铁路道岔故障自动诊断方法[J].自动化与仪器仪表,2023(2):16-20.
4李妍,何洪波,王闰强.微博热度预测研究综述[J].数据与计算发展前沿,2023,5(2):119-135.
5侯天宝,王爱银.基于Stacking特征增强多粒度联级Logistic的个人信用评估[J].河南师范大学学报（自然科学版）,2023,51(3):111-122. 被引量：1
6汤健,王子轩,夏恒,徐喆,韩红桂.面向智能回收装置的废旧手机深度森林识别[J].控制工程,2023,30(5):886-893.
7吕秀梅,张儒.网络小额贷款业务个人信用风险评估——基于DNN-SMOTEENN-ExtraTrees组合模型[J].数学的实践与认识,2023,53(7):14-21. 被引量：2
8胡桂荣,曹康栖,孟亚宏,张怡.基于全电流方向特征的低压配电网故障定位方法研究及分析[J].电力信息与通信技术,2024,22(2):83-90.
9林婉宜.基于人工智能的人力资源数据整合系统研究[J].中国高新科技,2024(5):42-44.
10郭文强,谭乔阳,雷明,马志龙.基于深度森林算法的返贫风险预警及防范[J].长沙大学学报,2024,38(2):1-8.

1黄新红,徐晓荣.大数据背景下企业财务会计向管理会计转型的策略[J].商场现代化,2020(10):183-184. 被引量：2
2叶佳鑫,熊回香,童兆莉,孟秋晴.在线医疗社区中面向医生的协同标注研究[J].数据分析与知识发现,2020,4(6):118-128. 被引量：4
3杨岚雁,靳敏,张迎春,张珣.一种基于关联规则的MLKNN多标签分类算法[J].计算机工程与科学,2020,42(7):1309-1317. 被引量：8
4郑连鸿,陈昭炎,王晓茵,王思帆.基于OpenCV的涡旋识别[J].电脑与电信,2020(4):30-35. 被引量：1
5刘然,晏颖,陈晓.脉络膜血管指数的临床运用研究进展[J].眼科新进展,2020,40(7):696-700. 被引量：2
6张程,王进,鲁晓卉,陆国栋,唐小林,李文萃.基于图像颜色和纹理特征的成品茶种类与等级识别[J].中国茶叶加工,2020(2):5-11. 被引量：10
7许郭樑.一种基于OCR技术在评价机器人轨迹可行性的应用[J].内燃机与配件,2020(12):233-234. 被引量：2
8王修信,杨路路,汤谷云,罗涟玲,孙涛,潘玉英.利用卷积神经网络提取高分辨率遥感图像喀斯特森林信息[J].科学技术与工程,2020,20(17):6773-6777. 被引量：6
9沈璐,王倩婷,施俊.基于特权信息集成学习的精神分裂症单模态神经影像计算机辅助诊断[J].生物医学工程学杂志,2020,37(3):405-411.
10邢新颖,冀俊忠,姚垚.基于自适应多任务卷积神经网络的脑网络分类方法[J].计算机研究与发展,2020,57(7):1449-1459. 被引量：8

电子设计工程

2020年第13期

浏览历史

内容加载中请稍等...

基于深度森林的量表数据挖掘方法被引量：4

参考文献9

二级参考文献85

共引文献92

同被引文献37

引证文献4

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于深度森林的量表数据挖掘方法 被引量：4

参考文献9

二级参考文献85

共引文献92

同被引文献37

引证文献4

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于深度森林的量表数据挖掘方法被引量：4