三支决策将不确定样本划分至边界域进行延迟决策,但需基于损失函数确定阈值,以划分边界域,然而,损失函数通常需要先验知识,具有一定的主观性,因此对边界域划分能力不足。针对这种问题,构建一种多目标三支决策边界域求解方法,从而更好地...三支决策将不确定样本划分至边界域进行延迟决策,但需基于损失函数确定阈值,以划分边界域,然而,损失函数通常需要先验知识,具有一定的主观性,因此对边界域划分能力不足。针对这种问题,构建一种多目标三支决策边界域求解方法,从而更好地划分边界域,提升分类性能。采用贝叶斯规则获取样本的条件概率;设定3个目标,包括降低边界域的不确定性、缩小边界域的大小以及减小整个决策区域的错误分类率,通过融入熵权法的TOPSIS(technique for order preference by similarity to an ideal solution)方法求取最优阈值,该方法采用熵权法计算这3个目标所占的权重,得到最优阈值,获得边界域,进行延迟决策;结合不同分类器对边界域进行分类。通过UCI数据集进行对比实验,根据分类准确率和F1值,表明该方法学习到的阈值能合理地划分边界域,建立的模型能取得更好的分类性能。展开更多
针对卡方自动交互诊断(CHAID)决策树易过拟合的问题,提出CHAID随机森林方法(CHAID Random Forest,CHAID-RF)。该方法采用随机采样、随机选择特征以及集成的策略,将CHAID决策树作为基分类器,形成CHAID-RF。为了验证CHAID-RF的有效性,选取...针对卡方自动交互诊断(CHAID)决策树易过拟合的问题,提出CHAID随机森林方法(CHAID Random Forest,CHAID-RF)。该方法采用随机采样、随机选择特征以及集成的策略,将CHAID决策树作为基分类器,形成CHAID-RF。为了验证CHAID-RF的有效性,选取CART、CHAID、SVM、RF作为对比算法,以准确率、加权查准率、加权查全率、加权F值作为分类模型评价指标,以均方根误差作为回归模型评价指标,采用10个分类数据集和7个回归数据集进行验证。实验结果表明CHAID-RF可行有效。展开更多
文摘三支决策将不确定样本划分至边界域进行延迟决策,但需基于损失函数确定阈值,以划分边界域,然而,损失函数通常需要先验知识,具有一定的主观性,因此对边界域划分能力不足。针对这种问题,构建一种多目标三支决策边界域求解方法,从而更好地划分边界域,提升分类性能。采用贝叶斯规则获取样本的条件概率;设定3个目标,包括降低边界域的不确定性、缩小边界域的大小以及减小整个决策区域的错误分类率,通过融入熵权法的TOPSIS(technique for order preference by similarity to an ideal solution)方法求取最优阈值,该方法采用熵权法计算这3个目标所占的权重,得到最优阈值,获得边界域,进行延迟决策;结合不同分类器对边界域进行分类。通过UCI数据集进行对比实验,根据分类准确率和F1值,表明该方法学习到的阈值能合理地划分边界域,建立的模型能取得更好的分类性能。
文摘针对卡方自动交互诊断(CHAID)决策树易过拟合的问题,提出CHAID随机森林方法(CHAID Random Forest,CHAID-RF)。该方法采用随机采样、随机选择特征以及集成的策略,将CHAID决策树作为基分类器,形成CHAID-RF。为了验证CHAID-RF的有效性,选取CART、CHAID、SVM、RF作为对比算法,以准确率、加权查准率、加权查全率、加权F值作为分类模型评价指标,以均方根误差作为回归模型评价指标,采用10个分类数据集和7个回归数据集进行验证。实验结果表明CHAID-RF可行有效。