基于K-均值聚类的多值有序Logistic回归模型在信用卡信用评级中的应用研究被引量：5

Multivariate Ordinal Logistic Regression Model and Theirs Application in Credit Scoring Based on K-Means Cluster

下载PDF

导出

摘要随着全球经济的发展,申请信用卡的人数激增,对于申请人的信用等级的评估显得尤为重要.从申请信用卡的大数据中选取出相对重要的特征变量,通过K-均值聚类方法对客户数据进行分类,分为多个类别.并建立了多值有序的Logistic回归模型.本文的全部输出结果均是在统计软件SAS 9.3环境下实现的,并且采用了SAS宏程序,实现大数据下银行信用卡申请人信用评级的批量数据处理和分析,同时也可将本文的方法推广到其他类似评级分类的大数据处理中. With the development of economy in the world, the number of people applying for credit cards is increasing. So it is very important to determine the credit score. We chose the more important feature variables from the big data sets about the credit card applicant. Then we clustered the applicant customers with K-Means cluster method and divided into several categories. And we built a multivariate ordinal logistic regression model. All the results of our paper were realized in the environment of statistical software SAS 9.3. Then we used the SAS macro program to realize the data processing and analysis of the credit rating of big data in bank. Meanwhile, we can solve similar problem to deal with big data of cluster and rating.

作者王纯杰李群董小刚林珊屹

机构地区长春工业大学基础科学学院

出处《吉林师范大学学报（自然科学版）》 2016年第3期72-81,共10页 Journal of Jilin Normal University:Natural Science Edition

基金国家自然科学基金青年基金项目(11301037) 国家自然科学基金面上项目(11571051) 吉林省教育厅"十三五"规划项目(2016317)

关键词聚类分析多值有序Logistic模型 SAS宏信用卡评分 cluster analysis multivariate ordinal logistic model SAS macro program credit scoring

分类号 O212.4 [理学—概率论与数理统计]

引文网络
相关文献

参考文献8

1刘莉亚.商业银行个人信贷信用评分模型的构建与应用[J].财经研究,2007,33(2):26-36. 被引量：14
2王莉,郑兆瑞,郝记秀.BP神经网络在信用风险评估中的应用[J].太原理工大学学报,2005,36(2):216-219. 被引量：15
3姜明辉,姜磊,王雅林.线性判别式分析在个人信用评估中的应用[J].管理科学,2003,16(1):53-55. 被引量：11
4史小康,何晓群.有偏logistic回归模型及其在个人信用评级中的应用研究[J].数理统计与管理,2015,34(6):1048-1056. 被引量：9
5徐菡.数据挖掘在信用卡客户精准营销中的应用[J].中国外资,2013(20):293-294. 被引量：3
6徐少锋,王延臣.个人信用评估中的LOGISTIC模型[J].天津轻工业学院学报,2003,18(B12):46-49. 被引量：10
7Dobson A J. An introduction to generalized linear models[M]. CRC press,2010.
8石庆焱,靳云汇.多种个人信用评分模型在中国应用的比较研究[J].统计研究,2004,21(6):43-47. 被引量：60

二级参考文献42

1冯恩波,肖德云,方崇智.一种基于时序预报神经网络的故障预报方法及其应用[J].自动化学报,1995,21(3):348-352. 被引量：11
2石晓军,肖远文,任若恩.Logistic违约率模型的最优样本配比与分界点研究[J].财经研究,2005,31(9):38-48. 被引量：49
3Baesens B ; Van Gestel T ; Viaene S ; Stepanova M ;Suykens J ; Vanthienen J ( 2003 ) Benchmarking state- ofthe-art classification algorithms for credit scoring,The Journal of the Operational Research Society,54,627 ～ 635.
4Desai,V S ,Crook,J N and Overstreet,G A (1996) A comparison of neural networks and linear scoring models in the credit environment.European Journal of Operational Research,95,24 ～ 37.
5Desai,V S ,Convay,D G ,Crook,J N and Overstreet G A (1997) Credit scoring models in the credit union environment using neural networks and genetic algorithms.IMA Journal of Mathematics Applied in Business and Industry,8,323 ～ 346.
6Rosenberg,E.and Gleit,A.(1994) Quantitative methods in credit management:a survey.Operations Research,42,589 ～ 613.
7Thomas,L C ,Edelman D B and Jonathan N.Crook (2002),Credit Scoring and Its Application,SIAM monographs on mathematical modeling and Computation,Philadelphia.
8Yobas,M.and Crook,J N ( 2000 ) Credit Scoring Using Neural and Evolutionary Techniques.IMA Statistics in Finance,Journal of Mathematics Applied in Business and Industry,11,111 ～ 125.
9J0hnBCaouette EdwardIAltman 石晓军译.演进着的信用风险管理[M].北京:机械工业出版社,2001..
10韩力群.人工神经网络的理论、设计与应用[M].北京:化学工业出版社,2002..

共引文献112

1陈秋华,杨慧荣,崔恒建.变量筛选后的个人信贷评分模型与统计学习[J].数理统计与管理,2020,39(2):368-380. 被引量：9
2都珂珂,黄全生,张玥.我国个人信用评估模型综述[J].经营与管理,2021(1):166-172. 被引量：4
3李佳佳.商业银行信用风险评估方法研究综述[J].广东经济,2017,0(9X):72-72.
4张成虎,李育林,吴鸣.基于判别分析的个人信用评分模型研究与实证分析[J].大连理工大学学报（社会科学版）,2009,30(1):6-10. 被引量：16
5陈玉芳,谢行恒.神经网络在个人信用组合预测中的应用[J].杭州电子科技大学学报（自然科学版）,2009,29(2):85-88.
6郑旭.我国商业银行信用风险识别的实证分析[J].中国城市经济,2012(1):3-4. 被引量：1
7石庆焱.一个基于神经网络——Logistic回归的混合两阶段个人信用评分模型研究[J].统计研究,2005,22(5):45-49. 被引量：39
8周晖,钮文洁,郑祥云,李涛,杨红.电力市场条件下客户信用管理的判别分析[J].广西电力,2005,28(4):67-70. 被引量：3
9赵子铱,赵素云.信用评分模型在中小企业信用风险评估中的应用[J].经济与管理,2005,19(11):70-72. 被引量：6
10张桂香,王秀芳.我国个人信用评级问题研究[J].河北软件职业技术学院学报,2005,7(4):15-18.

同被引文献26

1马燕.主成分分析法在学生成绩评价中的应用[J].乐山师范学院学报,2009,24(1):131-133. 被引量：4
2杨锦英,王碧泉.K—W检验和熵法在单个特征选择中的应用[J].华北地震科学,1989,7(2):23-35. 被引量：3
3谭庆.基于k-means聚类算法的试卷成绩分析研究[J].河南大学学报（自然科学版）,2009,39(4):412-415. 被引量：20
4刘宏亮,汪明杰.SAS软件在学生成绩相关性分析中的应用[J].林区教学,2012(4):16-18. 被引量：1
5Kuiyuan Li Josaphat Uvah Raid Amin.Predicting Students＇ Performance in Elements of Statistics[J].US-China Education Review(A),2012,2(10):875-884. 被引量：1
6杜强,陈乔,杨锐.基于Logistic模型的中国各省碳排放预测[J].长江流域资源与环境,2013,22(2):143-151. 被引量：73
7张乐勤,陈发奎.基于Logistic模型的中国城镇化演进对耕地影响前景预测及分析[J].农业工程学报,2014,30(4):1-11. 被引量：67
8孙荣.困境与出路:“摇号”政策应对城市公共资源分配难题[J].行政论坛,2014,21(5):56-60. 被引量：11
9侯晶.互联网金融背景下的小微企业融资模式探讨[J].价值工程,2015,34(29):90-91. 被引量：3
10朱琳,闫霏霏.基于SAS的高校学生成绩抽样及统计推断——以东华理工大学期末试卷抽样为例[J].东华理工大学学报（社会科学版）,2015,34(3):280-283. 被引量：1

引证文献5

1董小刚,佟知真,王纯杰,李纯净,张倩倩.高校学生成绩及教师教学效果SAS统计分析[J].长春工业大学学报,2017,38(3):209-217.
2黄天云,刘一平.基于二类Logistic回归的小微企业网贷在线评估及实现[J].西南民族大学学报（自然科学版）,2018,44(4):381-389. 被引量：1
3王纯杰,戚顺欣,罗琳琳,王淑影.临床开腹手术中基于Logistic回归模型对麻醉用法的分析[J].吉林师范大学学报（自然科学版）,2019,40(2):45-52. 被引量：1
4张国庆,昌宁.基于LightGBM的银行信用卡违约研究[J].科技资讯,2019,17(12):8-9. 被引量：7
5袁梦婷,杨碧容,吴叶文,杨莹莹,黄初.杭州市公证购房摇号政策对市民的影响及其满意度研究[J].锋绘,2020,0(1):167-168.

二级引证文献9

1陈霞.信用逾期预测中不同机器学习模型对比分析[J].计算机系统应用,2022,31(10):382-388. 被引量：2
2王方春.LightGBM算法在早期催收管理工作中的应用[J].电脑知识与技术,2020,16(7):205-206. 被引量：1
3王纯杰,戚顺欣,张洪阳.Logistic回归模型参数的贝叶斯估计及应用[J].统计与决策,2020(22):14-18. 被引量：7
4郭思杰,任春华,于亚婷.一种基于科技资源池的客户流失预测模型[J].制造业自动化,2021,43(6):120-125. 被引量：2
5刘新伟,黄武斌,蒋盈沙,郭润霞,黄玉霞,宋强,杨勇.基于LightGBM算法的强对流天气分类识别研究[J].高原气象,2021,40(4):909-918. 被引量：23
6杨磊,姚汝婧.基于Transformer的信用卡违约预测模型研究[J].计算机仿真,2021,38(8):440-444. 被引量：3
7代雯月.逻辑回归和支持向量机在客户信用分类中的应用[J].价值工程,2023,42(5):139-141. 被引量：2
8孙诚,沈芳,唐儒罡.基于SAR纹理和LightGBM的洪水淹没地区遥感应急监测[J].华东师范大学学报（自然科学版）,2023(3):82-92. 被引量：3
9吴锦华,王志生,刘重阳,胡龙彪.特征选择方法在信用评分系统中的应用[J].信息与电脑,2019,31(8):119-120.

1夏英俊,李元.债券评级的一种方法——主成分分析法[J].广州大学学报（自然科学版）,2005,4(1):26-28. 被引量：6
2史学勇,李元.信用评级的方法[J].广州大学学报（自然科学版）,2004,3(6):495-498. 被引量：2
3金哲,金林虎.Origin6.1在实验数据处理和分析中的应用[J].延边大学学报（自然科学版）,2002,28(4):271-273. 被引量：17
4史小康,常志勇.两类有偏logistic分布在信用评分模型中的应用[J].统计与决策,2015,31(14):19-23. 被引量：2
5运士伟,许超,张永胜.基于粗糙集模型的银行信用卡发放研究[J].数学的实践与认识,2009,39(15):42-46. 被引量：1
6盛夏,李斌,张迪.基于数据挖掘的上市公司信用评级变动预测[J].统计与决策,2016,32(15):159-162. 被引量：11
7Xiquan SHI.The Haar Wavelet Analysis of Matrices and Its Applications[J].Journal of Mathematical Research with Applications,2017,37(1):19-28.
8丁东洋,周丽莉.基于贝叶斯方法的信用评级模型构建与违约概率估计[J].统计与信息论坛,2010,25(9):8-15. 被引量：9
9张玺,刘明周.求解柔性作业车间调度问题的混合分布估计算法[J].系统科学与数学,2017,37(1):89-99. 被引量：2
10美国最大信用评级机构电脑模型出错[J].中国计算机用户,2008(25):26-26.

吉林师范大学学报（自然科学版）

2016年第3期

浏览历史

内容加载中请稍等...

基于K-均值聚类的多值有序Logistic回归模型在信用卡信用评级中的应用研究被引量：5

参考文献8

二级参考文献42

共引文献112

同被引文献26

引证文献5

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于K-均值聚类的多值有序Logistic回归模型在信用卡信用评级中的应用研究 被引量：5

参考文献8

二级参考文献42

共引文献112

同被引文献26

引证文献5

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于K-均值聚类的多值有序Logistic回归模型在信用卡信用评级中的应用研究被引量：5