期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种面向高维缺失不平衡数据的信用评估方法 被引量:3
1
作者 樊东醒 叶春明 《计算机应用研究》 CSCD 北大核心 2021年第9期2667-2672,共6页
传统随机森林填补方法并未考虑高维不平衡问题导致填补没有针对性,且使用0值预填补的方式可能会引入噪声并导致预测精度降低,因此提出一种基于Q学习和随机森林的缺失值填补方法(QL-RF)。该方法在特征选择后使用Q-learning权衡填补精度... 传统随机森林填补方法并未考虑高维不平衡问题导致填补没有针对性,且使用0值预填补的方式可能会引入噪声并导致预测精度降低,因此提出一种基于Q学习和随机森林的缺失值填补方法(QL-RF)。该方法在特征选择后使用Q-learning权衡填补精度和填补数量,通过计算奖励筛选出具有填补价值的样本和特征组合,然后利用冗余特征填补重要特征中的缺失,并重点填补了少数类样本。此外,为提高不平衡数据下的分类效果,基于Bagging框架提出一种融合量子粒子群算法(QPSO)和XGBoost的集成分类模型(QXB)。实验表明:QL-RF在G-means、F_(1)-measure、AUC指标下均优于传统RF填补法,QXB显著优于SMOTE-RF和SMOTE-XGBoost,所提方法能够有效地处理高维不平衡数据下的缺失和分类问题。 展开更多
关键词 高维不平衡 QL-RF BAGGING QPSO XGBoost QXB
下载PDF
基于PCA-k-means和PSO-SVM的AI上市公司财务预警 被引量:1
2
作者 樊东醒 叶春明 《科技和产业》 2021年第5期284-288,共5页
通过探索影响人工智能上市公司市值增长率的财务指标,建立融合主成分分析(PCA)和k-means的PCA-k-means模型,并将指标归类为盈利、效率、负债、成长因子。围绕ST公司和非ST公司的分类建立融合粒子群算法和支持向量机(PSO-SVM)模型,为财... 通过探索影响人工智能上市公司市值增长率的财务指标,建立融合主成分分析(PCA)和k-means的PCA-k-means模型,并将指标归类为盈利、效率、负债、成长因子。围绕ST公司和非ST公司的分类建立融合粒子群算法和支持向量机(PSO-SVM)模型,为财务预警工作提供支撑。实验选取了2019年人工智能行业42家非ST公司和8家ST公司的数据。结果表明,营运能力是人工智能上市公司最核心的成长能力,市场投资不仅关注短期利润更注重长期回报,行业投资趋于理性和稳健。 展开更多
关键词 PCA-k-means PSO-SVM 财务预警 营运能力
下载PDF
融合聚类过采样算法的信贷不平衡数据分类 被引量:3
3
作者 樊东醒 叶春明 《软件导刊》 2021年第11期70-74,共5页
不平衡数据往往会导致信用机构对“坏客户”的识别率较低。针对传统聚类过采样算法的边界样本损失问题,提出一种融合改进的K中心点算法的过采样方法——KmediodSMOTE,通过引入聚类准则函数和边界阈值以减少边界样本损失,并提出一种适用... 不平衡数据往往会导致信用机构对“坏客户”的识别率较低。针对传统聚类过采样算法的边界样本损失问题,提出一种融合改进的K中心点算法的过采样方法——KmediodSMOTE,通过引入聚类准则函数和边界阈值以减少边界样本损失,并提出一种适用于非平衡数据的K值选取方法——UET-SSE。首先,根据Pearson相关系数和少数类K近邻确定边界阈值,然后划分适合聚类采样的区域,并使用UET-SSE方法选取K值进行聚类,最后引入“中心度”的概念进行加权过采样。实验结果表明,该方法与经典过采样算法SMOTE、BorderlineSMOTE、KmeansSMOTE相比,在RF分类器下的G-means全为最高,F1-measure在4组数据中有3组最高,有效提高了不平衡数据的分类准确率。 展开更多
关键词 边界样本损失 KMediodSMOTE 聚类准则函数 边界阈值 UET-SSE 加权过采样
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部