-
题名基于改进图半监督学习的个人信用评估方法
被引量:4
- 1
-
-
作者
张燕
张晨光
张夏欢
-
机构
海南大学信息科学技术学院
北京工业大学计算机学院
-
出处
《计算机科学与探索》
CSCD
2012年第5期473-480,共8页
-
基金
海南省教育厅高等学校科学研究项目No.Hjkj2012-01~~
-
文摘
针对个人信用评估中未标号数据获取容易而已标号数据获取相对困难,以及普遍存在的数据不对称问题,提出了基于改进图半监督学习技术的个人信用评估模型。该模型采用了半监督学习技术,一方面能从大量的未标号数据中学习,避免了个人信用评估中已标号数据相对缺乏造成的泛化能力下降问题;另一方面,通过改进图半监督学习技术,对图半监督迭代结果进行归一化及修改决策边界,有效减小了数据不对称的影响。在UCI的三个信用审核数据集上的评测结果表明,该模型具有明显优于支持向量机和改进前方法的评估效果。
-
关键词
信用评估
支持向量机
图半监督学习
不对称数据集
-
Keywords
credit scoring
support vector machine
graph based semi-supervised learning
asymmetric dataset
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名平衡化图半监督学习方法
- 2
-
-
作者
张燕
张晨光
张夏欢
-
机构
海南大学信息科学技术学院
北京凌云光视公司图像处理部
-
出处
《系统科学与数学》
CSCD
北大核心
2016年第8期1107-1118,共12页
-
基金
海南省自然科学基金资助项目(20166211)
海南省高等学校科学研究项目(Hjkj2012-01)
国家自然科学基金(11261015)资助课题
-
文摘
许多机器学习的实际应用中都存在数据不平衡问题,即某类的样本数目要远小于其他类别.数据不平衡会使得分类问题中的分类面过于倾向于适应大类而忽略小类,导致测试样本被错误地判断为大类.针对该问题,文章提出了一种平衡化图半监督学习方法.该方法在能量函数中引入均衡化因子项,使得置信值不仅在图上尽量光滑且在不同类别之间也尽量均衡,有效减小了数据不均衡的不利影响,21个标准数据集上对比实验的统计分析结果表明新方法在数据不平衡时具有显著(显著性水平为0.05)优于支持向量机以及其他图半监督学习方法的分类效果.
-
关键词
不均衡数据集
图半监督学习
支持向量机
-
Keywords
imbalanced dataset, graph based semi-supervised learning, support vector machines
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-