为提高可消除项集的挖掘效率,在WPPC-Tree基础上提出优化后开始-结束序列树(start-finish-order tree,SFOTree),定义开始-结束序列集合(start-finish-order-set,SFO-Set)和开始-结束序列集合差(difference of start-finish-orderset,dSF...为提高可消除项集的挖掘效率,在WPPC-Tree基础上提出优化后开始-结束序列树(start-finish-order tree,SFOTree),定义开始-结束序列集合(start-finish-order-set,SFO-Set)和开始-结束序列集合差(difference of start-finish-orderset,dSFO-Set),建立项集的收益索引,提出一种基于dSFO-Set的可消除项集挖掘算法。利用dSFO-Set性质和收益索引,提高项集收益的计算效率,减少可消除项集的挖掘代价。分别在稠密数据集和稀疏模拟数据集上与传统算法进行测试比较,实验结果表明,该算法具有更好的挖掘效率。展开更多
文摘为提高可消除项集的挖掘效率,在WPPC-Tree基础上提出优化后开始-结束序列树(start-finish-order tree,SFOTree),定义开始-结束序列集合(start-finish-order-set,SFO-Set)和开始-结束序列集合差(difference of start-finish-orderset,dSFO-Set),建立项集的收益索引,提出一种基于dSFO-Set的可消除项集挖掘算法。利用dSFO-Set性质和收益索引,提高项集收益的计算效率,减少可消除项集的挖掘代价。分别在稠密数据集和稀疏模拟数据集上与传统算法进行测试比较,实验结果表明,该算法具有更好的挖掘效率。