-
题名面向延迟标签场景下的可解释信用评估模型
- 1
-
-
作者
辛博
丁志军
-
机构
嵌入式系统与服务计算教育部重点实验室(同济大学)
上海市网络金融安全协同创新中心(同济大学)
-
出处
《计算机科学》
CSCD
北大核心
2024年第8期45-55,共11页
-
文摘
随着社会经济的快速发展,信贷业务在金融领域中扮演着越来越重要的角色,利用机器学习算法进行信用评估成为了当前主流的方法。然而,目前仍存在一些问题亟待解决,如延迟标签带来的有标签数据不充分、模型滞后性的问题,以及动态信用评估模型缺乏可解释性的问题。针对这些问题,提出了一种面向延迟标签场景的可解释信用评估模型。该模型在动态模型树的基础上进行了加权改进,结合了延迟标签更新算法和自适应阈值的伪标签选择策略,将延迟标签数据看作反馈数据和伪标签数据两种状态分别进行处理,平衡了有标签数据不充分和模型滞后带来的影响,并实现了模型的可解释性。最后,在一些合成和真实的信用评估数据集上对模型进行了实验,与其他主流的算法相比,其更好地权衡了预测性能和可解释性。
-
关键词
信用评估
延迟标签
可解释性
动态模型树
伪标签选择
-
Keywords
Credit evaluation
Delayed label
Interpretability
Dynamic model tree
Pseudo-label selection
-
分类号
TP3-05
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于动态机器学习的信用评估模型
- 2
-
-
作者
陈奕君
高浩然
丁志军
-
机构
嵌入式系统与服务计算教育部重点实验室(同济大学)
上海市网络金融安全协同创新中心(同济大学)
-
出处
《计算机科学》
CSCD
北大核心
2023年第1期59-68,共10页
-
基金
上海市科技创新行动计划(19511101300)。
-
文摘
随着计算机技术的发展,利用机器学习算法构建自动化评估模型已经成为金融机构进行信用评估的重要手段。然而,目前信用评估模型仍存在一些问题:信用数据本身存在类别不平衡和高维特征的问题,并且不同的时间下外界环境的改变会影响信用主体的行为,即数据会产生概念漂移现象。为此,文中提出了一个动态的信用评估模型,通过集成学习在新的增量数据上训练基分类器,并对各个基分类器的权重进行动态调整来适应概念漂移,以实现模型的动态更新。当发生概念漂移时,会针对概念漂移的检测结果对高维不平衡的信用数据进行不同形式的均衡化和特征选择。特别地,针对特征选择,文中提出了结合历史代表性样本的增量特征选择算法,该算法能够进行高效准确的特征选择,从而使模型可以同时解决增量信用数据存在的高维不平衡和概念漂移问题。最后,文中选取了真实的增量高维信用数据集,验证了所提算法相比其他主流算法在准确率和效率上的优越性。
-
关键词
信用评估
特征选择
概念漂移
滑动窗口
动态模型
-
Keywords
Credit evaluation
Feature selection
Concept drift
Sliding window
Dynamic model
-
分类号
TP3-05
[自动化与计算机技术—计算机科学与技术]
-