期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于机器学习的银行个人信用风险评估研究被引量：1

Research on Bank Personal Credit Risk Assessment Based on Machine Learning

下载PDF

导出

摘要本文运用CCF竞赛提供的中原银行个人信用贷款违约数据,进行了数据清洗和特征工程的工作,从初始的38个特征缩减到18个特征,结合5C理论和预期收入理论探究了影响银行个人信用风险的重要因素,经过特征重要性排序排名前五的因素是:信贷周转余额合计、贷款发放日期据初始日期天数、借款人贷款评分平均分、当前贷款利率和匿名变量f0。为提升银行对个人信用风险评估的准确率,本文基于随机森林模型比较了SMOTE、随机欠采样和SMOTEENN三种非平衡数据的处理方法进行实验,SMOTEENN组合采样的效果最好;然后建立了决策树、随机森林、AdaBoost和LightGBM共4个机器学习模型,结果表明平衡后LightGBM的准确率最高,达到了96.1%。 In this paper, using the personal credit loan default data of Zhongyuan Bank provided by the CCF competition, the data cleaning and feature engineering was carried out and the initial 38 features were reduced to 18 features. Then the important factors affecting the bank personal credit risk were explored by combining the 5C theory and expected income theory, and the top five factors ranked by feature importance were: total credit working balance, loan disbursement date accord-ing to the initial date days, borrower’s average loan score, current loan interest rate and anonymous variable f0. In order to improve the accuracy of bank personal credit risk assessment, this paper compared three methods of processing unbalanced data, SMOTE, random under sampling and SMOTEENN, based on the random forest model, and SMOTEENN combined sampling had the best effect;then a total of four machine learning models, decision tree, random forest, AdaBoost and LightGBM, were established and it’s showed that LightGBM had the highest accuracy rate after bal-ancing, reaching 96.1%.

作者薛琦罗鄂湘

机构地区上海理工大学管理学院

出处《建模与仿真》 2023年第4期3747-3755,共9页 Modeling and Simulation

关键词贷款利率借款人个人信用风险非平衡数据随机森林模型机器学习数据清洗决策树

分类号 F83 [经济管理—金融学]

引文网络
相关文献

参考文献4

1顾洲一,胡丽娟.机器学习视角下商业银行客户信用风险评估研究[J].金融发展研究,2022(1):79-84. 被引量：6
2张丽颖,杨若瑾.基于机器学习的个人贷款违约预测模型的应用研究[J].金融监管研究,2022(6):46-59. 被引量：5
3张承钿,何浩龙,许建龙.基于异构集成模型的个人信用评估研究[J].计算机仿真,2022,39(3):485-489. 被引量：3
4罗方科,陈晓红.基于Logistic回归模型的个人小额贷款信用风险评估及应用[J].财经理论与实践,2017,38(1):30-35. 被引量：33

二级参考文献38

1李欣,俞卫琴.基于改进GS-XGBoost的个人信用评估[J].计算机系统应用,2020,29(11):145-150. 被引量：8
2都珂珂,黄全生,张玥.我国个人信用评估模型综述[J].经营与管理,2021(1):166-172. 被引量：4
3方匡南,吴见彬,朱建平,谢邦昌.信贷信息不对称下的信用卡信用风险研究[J].经济研究,2010,45(S1):97-107. 被引量：64
4于立勇,詹捷辉.基于Logistic回归分析的违约概率预测研究[J].财经研究,2004,30(9):15-23. 被引量：96
5于立勇,詹捷辉,金建国.内部评级法中违约概率与违约损失率的测算研究[J].统计研究,2004,21(12):22-26. 被引量：16
6梁琪.企业经营管理预警:主成分分析在logistic回归方法中的应用[J].管理工程学报,2005,19(1):100-103. 被引量：36
7李萌.Logit模型在商业银行信用风险评估中的应用研究[J].管理科学,2005,18(2):33-38. 被引量：49
8石晓军,任若恩,肖远文.边界Logistic违约率模型Bayes分析及实证研究[J].中国管理科学,2006,14(4):25-29. 被引量：14
9油永华.企业信用状况的定性评价——基于logistic回归模型的分析[J].统计与信息论坛,2006,21(6):85-88. 被引量：8
10葛君.基于Logistic模型的信用卡信用风险研究[J].中国信用卡,2010(24):26-32. 被引量：7

共引文献43

1李欣,俞卫琴.基于改进GS-XGBoost的个人信用评估[J].计算机系统应用,2020,29(11):145-150. 被引量：8
2李晓明,王志超.商业银行外汇业务数字化转型的经验与建议[J].新金融,2023(6):22-27. 被引量：2
3陈伟杰,龚涛,张兴建.混合信息下的小微企业信用评价方法研究[J].模糊系统与数学,2023,37(6):147-157. 被引量：1
4谢荻帆.基于机器学习的保险业风险监测预警模型研究[J].金融监管研究,2023(5):101-114. 被引量：2
5张丽颖,杨若瑾.基于机器学习的个人贷款违约预测模型的应用研究[J].金融监管研究,2022(6):46-59. 被引量：5
6邹柏松.信用风险分类预测单一模型研究及实证分析[J].武汉冶金管理干部学院学报,2017,27(2):16-20.
7王海峰,张晓妮,石宝峰.基于模糊聚类的P2P网贷个人信用评估模型及应用[J].浙江金融,2017(10):19-26. 被引量：3
8陈江涛,吕建秋.组合分类器在金融行业数据分类中的应用研究[J].计算机应用与软件,2018,35(2):325-329. 被引量：1
9晏翔.商业银行个人贷款风险因素实证分析[J].农村金融研究,2018(5):47-49. 被引量：3
10黄天云,刘一平.基于二类Logistic回归的小微企业网贷在线评估及实现[J].西南民族大学学报（自然科学版）,2018,44(4):381-389. 被引量：1

同被引文献6

1蔡晓妍,戴冠中,杨黎斌.谱聚类算法综述[J].计算机科学,2008,35(7):14-18. 被引量：189
2郭伟业,赵晓丹,庞英智,奇志.数据挖掘中SOM神经网络的聚类方法研究[J].情报科学,2009,27(6):874-876. 被引量：14
3姚旭,王晓丹,张玉玺,权文.特征选择方法综述[J].控制与决策,2012,27(2):161-166. 被引量：208
4杨俊闯,赵超.K-Means聚类算法研究综述[J].计算机工程与应用,2019,55(23):7-14. 被引量：303
5周广利.大数据背景下商业银行信贷安全管理策略研究——评《风控:大数据时代下的信贷风险管理和实践》[J].中国安全科学学报,2021,31(2):187-188. 被引量：14
6邓祥,俞璐.深度聚类算法综述[J].通信技术,2021,54(8):1807-1814. 被引量：4

引证文献1

1罗博炜,罗万红,谭家驹.融合SOM神经网络与K-means聚类算法的用户信用画像研究[J].铁路计算机应用,2024,33(7):14-19.

1张寒雪.新生儿抚触护理对早期新生儿生长发育的作用探讨[J].中文科技期刊数据库（文摘版）医药卫生,2022(10):109-111.
2鲁皓,韦怡,焦柳丹.基于GA-BP神经网络的信用卡贷后风险评级模型与实证[J].运筹与管理,2023,32(6):192-198. 被引量：1
3张晶,孙旬,张晓微.HCT、HGB、WBC指标检验在小儿上呼吸道感染疾病诊断中的价值[J].中文科技期刊数据库（全文版）医药卫生,2023(5):20-22.
4云本胜,干潇雅,钱亚冠.一种基于随机森林和改进卷积神经网络的网络流量分类方法[J].电信科学,2023,39(7):80-89. 被引量：5
5胡予晓.银行绿色信贷实施效果评价研究——基于模糊综合评价法[J].北方经贸,2023(7):99-103.
6陈贺.基于大数据背景下的企业信用评估研究[J].商情,2023(29):105-108.
7庞渤,耿稚雨.数字普惠金融的风险与监管研究[J].中文科技期刊数据库（全文版）经济管理,2023(7):198-201.
8令狐荣伟.血必净注射液灌注治疗慢性膝关节滑膜炎关节镜下手术的临床疗有效性分析[J].中文科技期刊数据库（文摘版）医药卫生,2022(1):78-80.
9王小慧.实时超声弹性成像在颈部结核性与肿瘤性淋巴结疾病中的应用价值[J].中文科技期刊数据库（全文版）医药卫生,2022(2):198-201.
10董雪,谭静仪,周旭毓,何震.中老年人活动水平与心血管健康研究[J].医学信息,2023,36(15):64-69. 被引量：2

建模与仿真

2023年第4期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部