-
题名基于改进SMOTE的不平衡数据分类算法
- 1
-
-
作者
马宝霖
胡茜
-
机构
长春工业大学数学与统计学院
-
出处
《长春工业大学学报》
CAS
2024年第3期259-264,共6页
-
基金
吉林省重大科技专项(20210301038GX)。
-
文摘
SMOTE算法是处理不平衡数据的一种经典的过采样算法,文中对该算法进行改进。首先采用k-means算法对原始数据进行聚类,利用类判别函数对聚类样本进行筛选,筛选出“安全样本”。然后利用新的过采样率对“安全样本”进行线性插值,并且在插值过程中采用LMKNN方法。分别将该算法与SMOTE、KNSMOTE应用至实际数据中,使用SVM分类算法分类并进行性能对比。结果表明,对Abalone、Ecoli等不平衡数据集分类时,文中使用的算法分类效果最佳,验证了该算法的有效性。
-
关键词
不平衡数据
SMOTE算法
SVM算法
-
Keywords
imbalanced data
SMOTE algorithm
SVM algorithm.
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名区间删失型协变量下加速失效模型的估计及其应用
- 2
-
-
作者
王纯杰
马宝霖
胡茜
蒋京京
-
机构
长春工业大学数学与统计学院
-
出处
《长春工业大学学报》
CAS
2022年第4期581-586,共6页
-
基金
国家自然科学基金资助项目(11671054)
吉林省重大科技专项(20210301038GX)
吉林省教育厅人文社科研究项目(JJKH20220649SK)。
-
文摘
对区间删失型协变量进行分析,并假定因变量的观测数据为右删失数据,在此基础上建立模型,进行参数估计,使用加速失效模型来研究失效时间和区间删失型协变量的关系。文中所使用的EM算法,通过一种两步循环迭代的算法去估计参数,并将此算法与之前常用的方法进行模拟比较,并应用到实际数据中进行分析。
-
关键词
区间删失型协变量
加速失效模型
EM算法
-
Keywords
interval censored covariates
accelerated failure model
EM algorithm
-
分类号
O212.1
[理学—概率论与数理统计]
-