基于最优基模型集成算法的信贷违约预测研究

Study on credit default prediction based on optimal base model ensemble algorithm

下载PDF

导出

摘要为了保障金融机构的金融安全,应用机器学习进行信贷违约预测已成为研究重点。为此,构建了6个机器学习基模型,调至最优参数后再分别用Voting、Stacking、Adaboost方法集成。实验表明,在多种基模型中,随机森林(RF)取得了较好的效果;而在集成方法中,Adaboost对基模型的提升最显著。文中构建的Adaboost-RF模型在信贷预测上的交叉验证得分达到了0.904,明显优于其它方法,该方法对金融机构制定信贷决策具有一定的借鉴意义。 In order to ensure the financial safety of financial institutions,the application of machine learning in credit default prediction has become a research focus.To this end,six machine learning base models are constructed,and after tuning to optimal parameters,they are integrated separately using Voting,Stacking and Adaboost methods.The experiment shows that among multiple base models,the Random Forest(RF)achieves better results;while in the ensemble methods,Adaboost had the most significant improvement on the base models.The Adaboost-RF model achieves a cross-validation score of 0.904 in credit prediction,which is significantly better than other methods,and this method has certain reference value for financial institutions in making credit decisions.

作者高艺婕 GAO Yijie(Department of Data Science and Big Data Technology,Shanghai International Studies Univesity,Shanghai 201620,China)

机构地区上海外国语大学数据科学与大数据技术系

出处《智能计算机与应用》 2023年第7期64-70,75,共8页 Intelligent Computer and Applications

关键词信贷预测机器学习集成学习随机森林 credit forecasting machine learning integrated learning Random Forest

分类号 TP399 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1陈霞.信用逾期预测中不同机器学习模型对比分析[J].计算机系统应用,2022,31(10):382-388. 被引量：2
2薛可桢,汤琪,朱鑫雨.大数据视角下商业银行信贷业务的风险管控研究[J].中国商论,2023(4):106-108. 被引量：4
3梁颢严.利用Logistic Regression建立贷款申请最大化利润模型[J].中国集体经济,2020(7):71-73. 被引量：1
4杨涛,刘文杰,丁宁.基于梯度下降算法的神经网络模型研究[J].网络安全技术与应用,2013(4):75-77. 被引量：9
5崔佳旭,杨博.贝叶斯优化方法和应用综述[J].软件学报,2018,29(10):3068-3090. 被引量：192
6孙斌,储芳芳,陈小惠.基于贝叶斯优化XGBoost的无创血压预测方法[J].电子测量技术,2022,45(7):68-74. 被引量：17

二级参考文献40

1于丽华.基丁神经网络的图像识别系统的研究[D].中国石油大学.2008.
2王丹,张代远.无线传感器网络LEACH路由算法的研究.计算机技术与发展.2010.
3滕扬,刘文杰,曹晓东.无线传感器网络数据路由协议研究[J].网络安全技术与应用,2008(4):23-25. 被引量：3
4向晖,杨胜刚.基于多分类器组合的个人信用评估模型[J].湖南大学学报（社会科学版）,2011,25(3):30-33. 被引量：17
5谭中明,谢坤,彭耀鹏.基于梯度提升决策树模型的P2P网贷借款人信用风险评测研究[J].软科学,2018,32(12):136-140. 被引量：17
6高建峰,张志荣.大数据时代商业银行风险管理优化[J].上海金融,2014(8):103-104. 被引量：20
7江明哲.借鉴大数据相关关系提升信贷审批前瞻性[J].上海金融,2015,0(2):100-106. 被引量：9
8潘晓文,赵永清.商业银行计提贷款损失准备进行利润平滑的研究[J].现代金融,2015(12):28-30. 被引量：1
9巴曙松,侯畅,唐时达.大数据风控的现状、问题及优化路径[J].金融理论与实践,2016(2):23-26. 被引量：46
10赵谞博,赫英迪,李信政,任蓉,任家东.基于支持向量回归的人体血压预测方法[J].燕山大学学报,2017,41(5):438-443. 被引量：13

共引文献217

1范霄,孔金玲,钟炎伶,蒋镒竹,张静雅.基于XGBoost算法的遥感图像云检测[J].遥感技术与应用,2023,38(1):156-162. 被引量：2
2徐畅,丁俊琦,赵聃桐,乔岩,张领先.基于LightGBM和处方数据的番茄病害诊断方法[J].农业机械学报,2022,53(9):286-294. 被引量：6
3黄灿,田冷,王恒力,王嘉新,蒋丽丽.基于条件生成式对抗网络的油藏单井产量预测模型[J].计算物理,2022,39(4):465-478. 被引量：2
4李文杰,王占刚.基于混合策略改进的LightGBM土壤污染预测模型[J].电子测量技术,2023,46(16):10-15.
5杨涛,刘文杰,丁宁.一种基于强信任关系的移动安全认证协议[J].网络安全技术与应用,2014(2):104-105.
6李向阳,曾文波.基于BP神经网络矩形微带天线谐振频率预测[J].广西科技大学学报,2014,25(3):26-31. 被引量：7
7许楠,刘丽杰,徐耀群.高斯激励混沌神经元系统及其应用[J].哈尔滨商业大学学报（自然科学版）,2014,30(5):599-603. 被引量：3
8许楠,李树政.基于Reflected Sigmoid激励混沌神经元的图像加密技术研究[J].网络安全技术与应用,2017(2):45-46. 被引量：1
9李华玲,黄钰靖.基于自编码器的深度神经网络管控算法[J].计算机工程与设计,2019,40(3):845-849. 被引量：2
10周闫明,石朋,瞿思敏,陈学秋,薛丰,谢志刚,李漫漫.基于贝叶斯优化算法的新安江模型参数优化及应用[J].水电能源科学,2019,37(5):6-9. 被引量：9

1周文婷.商业银行风险管理中经济成本的分析[J].中文科技期刊数据库（全文版）经济管理,2023(9):97-99.
2吴建国,魏巍,郭鑫垚,闫京.度量学习引导的加权聚类集成算法[J].小型微型计算机系统,2023,44(8):1607-1615.
3刘勘,於陆,徐勤亚.政策事理图谱构建及应用[J].软件导刊,2023,22(8):1-9. 被引量：1
4文倩.商业银行信贷决策中的大数据应用研究[J].信息产业报道,2023(3):76-78.
5何智成,韩茳,宋贤海,张桂勇.基于改进Stacking集成学习的高强度钢柱屈曲能力预测[J].计算力学学报,2023,40(4):585-593. 被引量：1
6程陈,李春,李文明,叶晨洋,王岳胜,赵承森,丁枫华,金志凤,冯利平,黎贞发.园艺作物发育期和采收期模拟模型的最优模拟路径[J].农业工程学报,2023,39(12):158-167. 被引量：3
7曹冠杰,史志涛,王彩华,孙占国,陈月芹,靳超,李新勃.CT放射组学联合血清肿瘤标志物对不确定性质肺结节恶性风险的预测价值[J].临床肺科杂志,2023,28(9):1321-1326. 被引量：4
8宋琪哲,黄聪慧,李梦梦,苏畅,王惠君,张兵,武振宇.基于随机森林方法的常见人体中农兽药及化学污染物暴露与高尿酸血症的关联性研究[J].中国食品卫生杂志,2023,35(5):645-651.
9芦园月,李子良,李旺鑫,刘艳琴,李荣山,周晓霜.机器学习在山西省农村地区蛋白尿筛查中的初探[J].中华肾脏病杂志,2023,39(7):491-498.
10岳瀚栋,窦挺峰,李润奎,丁明虎,效存德.基于多种机器学习及其堆叠式集成方法的月尺度北极海冰预测研究[J].冰川冻土,2023,45(3):893-901. 被引量：2

智能计算机与应用

2023年第7期

浏览历史

内容加载中请稍等...

基于最优基模型集成算法的信贷违约预测研究

参考文献6

二级参考文献40

共引文献217

相关作者

相关机构

相关主题

浏览历史