传统的C4.5分类决策树作为数据分类算法具有计算简单、准确率高的优势,由于飞机具有参数多和数据量大的因素,C4.5算法需要对连续属性值进行多次顺序扫描,分类时间效率较低。针对此问题,提出近似粗糙集和决策分辨力分类算法,利用粗糙集...传统的C4.5分类决策树作为数据分类算法具有计算简单、准确率高的优势,由于飞机具有参数多和数据量大的因素,C4.5算法需要对连续属性值进行多次顺序扫描,分类时间效率较低。针对此问题,提出近似粗糙集和决策分辨力分类算法,利用粗糙集近似度来判断属性划分样本数据能力,并将其代入到决策分辨力算法中,以决策分辨力最大的属性作为分裂特征建立分类决策树。算法在保证分类决策准确率的同时,提高计算效率并减少过拟合问题的产生。通过对UCI(University of California, Irvine)数据集上多组数据样本的对比实验分析,验证了本文提出PSRP(rough set and resolving power)的算法在保证相同准确率的情况下,平均计算时间效率提升约10%,可靠性提升2%。展开更多
文摘传统的C4.5分类决策树作为数据分类算法具有计算简单、准确率高的优势,由于飞机具有参数多和数据量大的因素,C4.5算法需要对连续属性值进行多次顺序扫描,分类时间效率较低。针对此问题,提出近似粗糙集和决策分辨力分类算法,利用粗糙集近似度来判断属性划分样本数据能力,并将其代入到决策分辨力算法中,以决策分辨力最大的属性作为分裂特征建立分类决策树。算法在保证分类决策准确率的同时,提高计算效率并减少过拟合问题的产生。通过对UCI(University of California, Irvine)数据集上多组数据样本的对比实验分析,验证了本文提出PSRP(rough set and resolving power)的算法在保证相同准确率的情况下,平均计算时间效率提升约10%,可靠性提升2%。