基于模型融合的互联网信贷信用风险预测研究被引量：4

Research on Internet Credit Risk Prediction Based on Model Fusion

下载PDF

导出

摘要互联网信贷信用风险的预测是互联网金融可持续发展的关键因素,在放贷前准确预估借款人的信用风险,能有效较低企业可能的风险损失。随着机器学习的发展,机器学习的算法模型在互联网信贷信用风险方面的应用也越来越多。为了探究树模型和线性模型融合在互联网信贷信用风险预测的效果,本文采用Stacking模型融合方法设计了信用风险预测模型,其中第一层模型为随机森林、XGBoost、LightGBM,第二层模型为逻辑回归。并且在拍拍贷的真实数据上进行实验,对比了融合后的模型和单模型在AUC、准确率和耗时上的表现,结果表明融合后的模型虽然耗时长一些,但是在AUC和准确率方面都比单模型的效果要好,为互联网金融信贷风险预测模型的构建提供了一个新的思路。 The prediction of the credit risk of Internet credit is a key factor for the sustainable development of Internet finance. It can accurately estimate the credit risk of borrowers before lending, effectively reducing the possible risk loss of enterprises. With the development of machine learning, the algorithm model of machine learning has been applied more and more in the credit risk of Internet credit. In order to explore the effect of integrating tree model and linear model in the prediction of credit risk of Internet credit, this paper adopts Stacking model fusion method to design the credit risk prediction model, in which the first layer model is random forest, XGBoost and LightGBM and the second layer model is logistic regression, and conducts experiments on the real data of Clap to Borrow. Compared with the performance of the single model on AUC, accuracy and time consuming, the results show that the fused model, although takes longer time, but performs better in terms of AUC and accuracy, which provides a new idea for the construction of financial credit risk prediction model.

作者费鸿雁黄浩

机构地区对外经济贸易大学信息学院

出处《统计学与应用》 2019年第5期823-834,共12页 Statistical and Application

基金国家重点研发计划资助(National Key R&D Program of China),项目编号:2017YFB1400700。

关键词逻辑回归信用风险随机森林 XGBoost模型 LightGBM模型

分类号 F83 [经济管理—金融学]

引文网络
相关文献

参考文献2

1于晓虹,楼文高.基于随机森林的P2P网贷信用风险评价、预警与实证研究[J].金融理论与实践,2016(2):53-58. 被引量：47
2李昕,戴一成.基于BP神经网络的P2P网贷借款人信用风险评估研究[J].武汉金融,2018,0(2):33-37. 被引量：9

二级参考文献27

1罗明雄.互联网金融[M].北京:中国财政经济出版社.2014.5.33,134.
2Michael Klafft.Peer to peer Lending:Auctioning Microcredits over the Internet[A].Proceedings of the International Conference on Information Systems[J].Technology and Management,2008(2):1-8.
3Eunkyoung Lee,Byungtae Lee,Myungsin Chae.Herding Behavior in online P2P Lending:An Empirical Investigation[J].Journal Electronic Commerce Research and Applications,2012,11(5):495-503.
4Stat Soft Inc.Electronic Statistics Textbook[EB].Tulsa(http://www.statsoft.com/textbook),2011.
5Zhang G,Patuwo E,and Hu M.Forecasting with Artificial Neural Networks:The State of the Art[J].International Journal of Forecasting,1998(14):35-62.
6Breiman L.Random Forests[J].Machine Learning,2001,45(1):5-32.
7Biau G.Analysis of a Random Forests Model[J].Journal of Machine Learning Research,2012,13(April):1063-1095.
8Malekipirbazari M,Aksakalli V.Risk Assessment in Social Lending via Random Forests[J].Expert Systems with Applications,2015,42(10):4621-4631.
9楼文高,乔龙.基于神经网络的金融风险预警模型及其实证研究[J].金融论坛,2011,16(11):52-61. 被引量：41
10方匡南,吴见彬,朱建平,谢邦昌.随机森林方法研究综述[J].统计与信息论坛,2011,26(3):32-38. 被引量：643

共引文献54

1韩天红,黎丁铭.用户借贷违约风险与信用数据关系的统计分析[J].质量与市场,2021(13):137-139.
2谭中明,谢坤,彭耀鹏.基于梯度提升决策树模型的P2P网贷借款人信用风险评测研究[J].软科学,2018,32(12):136-140. 被引量：17
3隋婷婷,张友棠,张雅倩.P2P网贷平台资金风险预警指数模型构建——基于三维视角[J].财会通讯（中）,2016(6):81-84. 被引量：6
4滕磊.担保机制下网络贷款信用风险传导机理研究[J].浙江金融,2016(9):9-15. 被引量：2
5刘镜秀,门明.P2P网络借贷市场对资本市场的风险溢出效应[J].技术经济,2016,35(11):97-104. 被引量：6
6许楠,罗蕾,李蕾红.基于熵权灰色关联TOPSIS法的涉农P2P网贷项目优选研究[J].数学的实践与认识,2017,47(3):37-45. 被引量：8
7李国义.互联网金融中的信用风险形成机理研究[J].哈尔滨商业大学学报（社会科学版）,2017(3):38-45. 被引量：10
8王重仁,韩冬梅.基于卷积神经网络的互联网金融信用风险预测研究[J].微型机与应用,2017,36(24):44-46. 被引量：14
9闫春,孙海棠,李亚琪.基于随机森林与RFM模型的财险客户分类管理研究[J].科技与经济,2018,31(1):56-60. 被引量：4
10戴德宝,倪立平,薛铭.基于k-means和SVM的银行个人信用评估应用[J].江苏科技大学学报（自然科学版）,2017,31(6):836-842. 被引量：2

同被引文献30

1陈凯.基于分类问题的选择性集成学习研究[J].计算机应用研究,2009,26(7):2457-2459. 被引量：3
2陈全,赵文辉,李洁,江雨燕.选择性集成学习算法的研究[J].计算机技术与发展,2010,20(2):87-89. 被引量：2
3向晖,杨胜刚.基于多分类器组合的个人信用评估模型[J].湖南大学学报（社会科学版）,2011,25(3):30-33. 被引量：17
4张春霞,张讲社.选择性集成学习算法综述[J].计算机学报,2011,34(8):1399-1410. 被引量：136
5谭中明,谢坤,彭耀鹏.基于梯度提升决策树模型的P2P网贷借款人信用风险评测研究[J].软科学,2018,32(12):136-140. 被引量：17
6张奇,胡蓝艺,王珏.基于Logit与SVM的银行业信用风险预警模型研究[J].系统工程理论与实践,2015,35(7):1784-1790. 被引量：35
7陈云,石松,潘彦,俞立.基于SVM混合集成的信用风险评估模型[J].计算机工程与应用,2016,52(4):115-120. 被引量：27
8方匡南,范新妍,马双鸽.基于网络结构Logistic模型的企业信用风险预警[J].统计研究,2016,33(4):50-55. 被引量：58
9陆尧胜,尤启杭,李晓东.基于模糊理论和欧氏距离自动分析胎儿状态[J].生物医学工程学杂志,2016,33(3):436-441. 被引量：3
10杨菊,袁玉龙,于化龙.基于蚁群优化的极限学习机选择性集成学习算法[J].计算机科学,2016,43(10):266-271. 被引量：6

引证文献4

1陈霞.信用逾期预测中不同机器学习模型对比分析[J].计算机系统应用,2022,31(10):382-388. 被引量：2
2张映春.“互联网+”环境下的出版社编辑工作转型路径的探索[J].传播与版权,2020,0(3):46-47. 被引量：4
3曾冬洲,郑宗华,谢婧娴.基于GBDT-LR融合算法的胎儿窘迫预诊模型研究[J].自动化仪表,2021,42(5):75-79. 被引量：2
4王茂光,杨行.一种基于AP-Entropy选择集成的风控模型和算法[J].计算机科学,2021,48(S02):71-76. 被引量：1

二级引证文献9

1程姝.“互联网+”时代下出版社编辑工作的转型研究[J].传媒论坛,2021,4(18):97-98. 被引量：3
2宋涛.论编辑创新在出版工作中的重要性[J].采写编,2022(9):148-150.
3王羽佳.移动互联网与大数据相结合的高等教育类图书出版融合创新策略研究[J].文化创新比较研究,2022,6(16):56-59. 被引量：1
4董理科,白鹭,武娜,杨冬冬.基于知识图谱的电力变压器故障预测方法研究[J].高压电器,2022,58(11):151-159. 被引量：12
5雷霁,薛黎,呼雪梅.“互联网+”时代出版社编辑工作的创新思考[J].采写编,2022(11):147-149. 被引量：3
6汤晶晶.基于集成TrAdaBoost模型的信用违约预测[J].电脑编程技巧与维护,2023(6):35-36.
7王萌,弭博岩,郑奋.人工智能技术在胎儿健康监测领域的应用[J].中国实验诊断学,2023,27(6):755-756.
8高艺婕.基于最优基模型集成算法的信贷违约预测研究[J].智能计算机与应用,2023,13(7):64-70.
9唐玉梅,李丹杨,何庆.基于遗传算法和集成剪枝的表情识别方法[J].四川轻化工大学学报（自然科学版）,2023,36(5):67-75.

1赵迎,何华,吴超.基于CS-RF模型的微额信贷风险预测[J].时代金融,2019,0(8):174-177. 被引量：1
2廖威平,陈平华,赵璁,赵亮,陈建兵,董梦琴.基于CNN和LightGBM的环境声音分类[J].计算机科学与应用,2019,9(10):1892-1905.
3林润泽,王行健,冯毅萍,赵久强.基于数字孪生的智能装配机械臂实验系统[J].实验室研究与探索,2019,38(12):83-88. 被引量：23
4王亮,毕峰,王文善,李仁杰,魏辉翔.异步式磁力耦合器气隙改变对转矩影响的分析研究[J].煤矿机械,2019,40(11):34-36. 被引量：3
5唐桂林.注册会计师的独立性及行业监管[J].经济师,2020,0(1):152-153.
6方丽雯.推动金融创新缓解中小企业融资难的研究[J].理财（审计）,2019(11):39-41.
7阮振旻,李荣芳,莫迪.管理会计工具在建筑施工企业风险管理中的应用[J].中国总会计师,2019,0(12):158-159. 被引量：4
8央视网评:“爬虫”滥觞窃取数据的行径该整肃了[J].电脑知识与技术（经验技巧）,2019,0(11):113-113.
9张伟强,田原.从混乱到有序——日本消费金融“三恶”的治理经验[J].清华金融评论,2019,0(12):109-112. 被引量：1
10朱毅,刘永辉,涂业奇.基坑轴力智能化监测中缺失与异常数据分析处理的研究与应用[J].广州建筑,2019,47(5):30-34. 被引量：3

统计学与应用

2019年第5期

浏览历史

内容加载中请稍等...

基于模型融合的互联网信贷信用风险预测研究被引量：4

参考文献2

二级参考文献27

共引文献54

同被引文献30

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于模型融合的互联网信贷信用风险预测研究 被引量：4

参考文献2

二级参考文献27

共引文献54

同被引文献30

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于模型融合的互联网信贷信用风险预测研究被引量：4