面向不完备数据的民航旅客流失预测模型被引量：2

Civil aviation passenger loss prediction model for incomplete data

下载PDF

导出

摘要为解决新一代民航旅客服务信息系统中数据缺失不能准确进行旅客流失预测的问题,考虑旅客流失预测任务与旅客缺失数据填补任务具有相关性,提出基于部分距离的SMOTE算法和基于降噪自编码器的多任务深度学习网络模型。基于部分距离的SMOTE算法在数据不完备场景下,对少数类别已流失旅客和准流失旅客进行过采样;设计的多任务深度学习网络模型利用逐层无监督训练和有监督微调,同时进行对缺失数据填补与民航旅客流失预测。实验结果表明,相比传统处理方法,该方法能有效提高数据质量和旅客流失预测的准确性。 To solve the problem that the data loss in the new generation civil aviation passenger service information system causes inaccurate prediction of passenger loss,considering the correlation between the passenger loss prediction task and the passenger missing data filling task,a partial distance based SMOTE algorithm and noise reduction based self-encoding were proposed for multitasking deep learning network model.Through the partial distance-based SMOTE algorithm,in the data incomplete scena-rio,a few categories of lost passengers and quasi-lost passengers were oversampled,and the multi-task deep learning network model was designed to utilize layer-by-layer unsupervised training and supervised fine-tuning.The prediction of missing data and civil aviation passenger loss was carried out.Experimental results show that compared with the traditional processing method,the proposed method can effectively improve the data quality and the accuracy of passenger loss prediction.

作者李国袁闻王怀超 LI Guo;YUAN Wen;WANG Huai-chao(School of Computer Science and Technology,China Civil Aviation University,Tianjin 300300,China;Information Technology Research Base of Civil Aviation Administration of China,China Civil Aviation University,Tianjin 300300,China)

机构地区中国民航大学计算机科学与技术学院中国民航大学中国民航信息技术科研基地

出处《计算机工程与设计》北大核心 2020年第10期2884-2891,共8页 Computer Engineering and Design

基金民航科技重大专项基金项目(MHRD20150107、MHRD20160109)。

关键词民航旅客服务信息系统缺失值旅客流失预测多任务学习降噪自编码器 SMOTE算法 civil aviation passenger service information system missing value passenger loss prediction multi-task lear-ning denoising autoencoder SMOTE algorithm

分类号 TP315.69 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献13

1罗康洋,王国强.L-SMOTE与SVM结合的不平衡数据集分类研究[J].计算机工程与应用,2019,55(17):55-62. 被引量：12
2徐光伟,白艳珂,燕彩蓉,杨延彬,黄永锋.大数据存储中数据完整性验证结果的检测算法[J].计算机研究与发展,2017,54(11):2487-2496. 被引量：22
3赵其鲁,李宗民.基于深度多任务学习的层次分类[J].计算机辅助设计与图形学学报,2018,30(5):886-892. 被引量：5
4李湘滨,郑芸,熊国民.面向民航开放平台的主数据识别与管理[J].计算机与数字工程,2015,43(7):1304-1307. 被引量：5
5郑洪峰.从飞行的本源探究民航服务价值——民航旅客需求挖掘[J].民航管理,2018,0(5):28-30. 被引量：3
6曹卫东,白亮,聂笑盈.基于Map/Reduce的民航高价值旅客发现方法[J].计算机工程与设计,2015,36(4):1078-1083. 被引量：5
7Chuankun Li,Dongfeng Zhao,Shanjun Mu,Weihua Zhang,Ning Shi,Lening Li.Fault diagnosis for distillation process based on CNN–DAE[J].Chinese Journal of Chemical Engineering,2019,27(3):598-604. 被引量：13
8Xuyun FU,Hui LUO,Shisheng ZHONG,Lin LIN.Aircraft engine fault detection based on grouped convolutional denoising autoencoders[J].Chinese Journal of Aeronautics,2019,32(2):296-307. 被引量：8
9郑奇斌,刁兴春,曹建军.结合缺失模式的不完整数据模糊聚类[J].计算机科学,2017,44(12):58-63. 被引量：4
10贾文娟,张煜东.自编码器理论与方法综述[J].计算机系统应用,2018,27(5):1-9. 被引量：23

二级参考文献166

1阳春华,王觉,朱红求,桂卫华.一种混合核函数SVM建模方法及其应用[J].控制工程,2010,17(4):524-526. 被引量：11
2郑恩辉,李平,宋执环.代价敏感支持向量机[J].控制与决策,2006,21(4):473-476. 被引量：33
3张冰,孔锐.一种支持向量机的组合核函数[J].计算机应用,2007,27(1):44-46. 被引量：22
4Xing E P, Ng A Y, Jordan M I, Russell S. Distance metric learning with application to clustering with side- information. In: Proceedings of the 2003 Advances in Neural Information Processing Systems. Vancouver, Canada: MIT Press, 2003. 521-528.
5Goldberger J, Roweis S, Hinton G, Salakhutdinov R. Neigh- bourhood components analysis. In: Proceedings of the 2004.Advances in Neural Information Processing Systems. Van- couver, Canada: MIT Press, 2004. 513-520.
6Weinberger K Q, Saul L K. Distance metric learning for large margin nearest neighbor classification. JournM of Ma- chine Learning Research, 2009, 10:207-244.
7Xiang S M, Nie F P, Zhang C S. Learning a Mahalanobis dis- tance metric for data clustering and classification. Pattern Recognition, 2008, 41(12): 3600-3612.
8Mensink T, Verbeek J, Perronnin F, Csurka G. Metric learn- ing for large scale image classification: generalizing to new classes at near-zero cost. In: Proceedings of the 12th Eu- ropean Conference on Computer Vision. Florence, Italy: IEEE. 2012. 488-501.
9Feng Z Jin 1 Jain A. Large-scale image annotation by ef- ficient and robust kernel metric learning. In: Proceedings of the 2013 International Conference on Computer Vision. Sydney, Australia: IEEE, 2013. 1609-1616.
10Wang X Y, Hua G, Han T X. Discriminative tracking by metric learning. In: Proceedings of the llth European Con- ference on Computer Vision. Heraklion, Greece: Springer, 2010. 200-214.

共引文献127

1李文举,张耀星,陈慧玲,李培刚,沙利业.基于TSCD模型的轨道板裂缝检测方法[J].应用科学学报,2022,40(1):155-166. 被引量：2
2舒忠.基于深度学习的图像样本标签赋值校正算法实现[J].数字印刷,2019(4):38-45. 被引量：2
3缪海旭.民航旅客价值初探[J].经营与管理,2021(4):30-34. 被引量：2
4崔宇,侯慧娟,苏磊,钱涛,盛戈皞,江秀臣.考虑不平衡案例样本的电力变压器故障诊断方法[J].高电压技术,2020,46(1):33-41. 被引量：28
5王信堂,梁志锋.网络恶意入侵下破损数据及时存储方法仿真[J].计算机仿真,2019,36(1):316-319. 被引量：3
6姚丽华,于广州.关系型数据库信息资源检索结果分类方法仿真[J].计算机仿真,2019,36(1):445-448. 被引量：4
7曾俊杰,王晓明,杨晓欢.基于局部保持的KNN算法[J].西华大学学报（自然科学版）,2015,34(6):58-63.
8罗可,周安众.基于KL距离的卷积神经网络人脸特征提取模型[J].长沙理工大学学报（自然科学版）,2017,14(2):85-91. 被引量：1
9邹国锋,傅桂霞,高明亮,尹丽菊,王科俊.融合类别和结构信息的多尺度协同耦合度量学习方法[J].模式识别与人工智能,2017,30(6):499-508. 被引量：1
10梁路,龚奔龙,黎剑,滕少华.一种缓解分类面交错的样本点扩散方法[J].计算机科学,2017,44(9):286-289.

同被引文献12

1王守相,陈海文,潘志新,王建明.采用改进生成式对抗网络的电力系统量测缺失数据重建方法[J].中国电机工程学报,2019,39(1):56-64. 被引量：84
2张峰,宋晓娜,薛惠锋,王海宁.水资源消耗预测的异常值检测及缺失数据填补方法[J].统计与决策,2018,0(16):13-17. 被引量：8
3张若愚,齐波,张鹏,李成榕.面向电力变压器状态评价的油中溶解气体监测数据补全方法[J].电力自动化设备,2019,39(11):181-187. 被引量：16
4陈小波,陈程,陈蕾,韦中杰,蔡英凤,周俊杰.基于改进低秩矩阵补全的交通量数据缺失值插补方法[J].交通运输工程学报,2019,19(5):180-190. 被引量：8
5李培冠,於志勇,黄昉菀.基于稀疏表示的电力负荷数据补全[J].计算机科学,2021,48(2):128-133. 被引量：5
6邓子畏,唐朝晖,朱红求,赵于前.基于改进EM算法的混凝土泵车数据治理[J].中南大学学报（自然科学版）,2021,52(2):443-449. 被引量：4
7胡雪,彭敦陆.张量表达下的多模态交通缺失数据补全算法[J].小型微型计算机系统,2021,42(1):105-110. 被引量：2
8闫媞锦,夏元清,张宏伟,韦闽峰,周彤.一种非规则采样航空时序数据异常检测方法[J].航空学报,2021,42(4):552-562. 被引量：10
9郭毅博,牛猛,王海迪,陈艳华,薛均晓,袁玥,侯立硕,徐明亮,潘俊.基于生成对抗网络的飞机燃油数据缺失值填充方法[J].浙江大学学报（理学版）,2021,48(4):402-409. 被引量：10
10赵厚翔,沈晓东,吕林,兰鹏,刘俊勇,刘代勇.基于GAN的负荷数据修复及其在EV短期负荷预测中的应用[J].电力系统自动化,2021,45(16):143-151. 被引量：19

引证文献2

1汪广明,何滔,熊玺,卢玉龙,王明涛.基于改进循环神经网络的多数据流缺失值估计[J].粘接,2022(2):108-111.
2杜婧涵,胡明华,尹嘉男.基于链式方程多重插补的机场场面数据补全[J].航空计算技术,2022,52(5):1-4.

1孙立健,周鋆,张维明.一种新的多任务朴素贝叶斯学习方法[J].信息工程大学学报,2020,21(2):221-226.
2宋欣瑞,张宪琦,张展,陈新昊,刘宏伟.多传感器数据融合的复杂人体活动识别[J].清华大学学报（自然科学版）,2020,60(10):814-821. 被引量：11
3宋亮,万建洲.缺失数据插补方法的比较研究[J].统计与决策,2020(18):10-14. 被引量：20
4董明刚,刘明,敬超.利用采样安全系数的多类不平衡过采样算法[J].计算机科学与探索,2020,14(10):1776-1786. 被引量：3
5高志宏.不文明旅客法律拘束机制研究[J].南京航空航天大学学报（社会科学版）,2020,22(4):73-79. 被引量：3
6訾壮壮,何涛,赵停.基于稀疏表示的不平衡数据集过采样算法[J].计算机应用与软件,2020,37(10):290-294. 被引量：2
7吴小伟,陆莹洁.科技创业服务信息系统整合的设计与实现[J].江苏科技信息,2020,37(23):42-44. 被引量：1
8蒋亦樟,华蕾,张群,钱鹏江,夏开建.多任务模糊聚类驱动的多任务TSK模糊系统模型[J].应用科学学报,2020,38(5):742-760. 被引量：1
9郭金喜,刁科,张晓娜,赵云,路璐,高宇,高蓓蓓,魏薇,张霞,石慧君,唐广贤.前部缺血性视神经病变患者图形视觉诱发电位与视功能改变的关系及其临床意义[J].现代生物医学进展,2020,20(15):2975-2978. 被引量：5
10盛松,黄烨,杨志旭,李婧,徐凤芹.老药新用:基于基因表达谱和Connectivity Map对丹参酮ⅡA药理作用的再认识[J].中西医结合心脑血管病杂志,2020,18(18):2967-2973. 被引量：1

计算机工程与设计

2020年第10期

浏览历史

内容加载中请稍等...

面向不完备数据的民航旅客流失预测模型被引量：2

参考文献13

二级参考文献166

共引文献127

同被引文献12

引证文献2

相关作者

相关机构

相关主题

浏览历史

面向不完备数据的民航旅客流失预测模型 被引量：2

参考文献13

二级参考文献166

共引文献127

同被引文献12

引证文献2

相关作者

相关机构

相关主题

浏览历史

面向不完备数据的民航旅客流失预测模型被引量：2