摘要
为了解决传统分类算法梯度提升决策树(Gradient Boosting Decision Tree,GBDT)在多分类情况下由于样本不平衡和数据量大的情况下收敛速度较慢的不足,提出基于焦点损失(Focal Loss,FL)的FLGBDT算法。该算法与AdaBoost的主要区别在于采用基于概率的简单形式来修改样本权重,减少计算量,提高了收敛速度。利用癌症患者的RNA基因序列数据集进行训练与验证,并与原始GBDT、随机森林(Random Forest,RF)算法所得到的数据进行对比分析,结果表明FLGBDT与原始GBDT算法相比有更快的收敛速度、与RF算法相比具有更快的收敛速度和更高的精度。
出处
《机电技术》
2020年第3期32-35,67,共5页
Mechanical & Electrical Technology