频繁项集挖掘算法的计算复杂性和生成的频繁项集数量随着事务集项数的增加呈指数增长,最小支持度阈值成为控制这种增长的关键.然而,实际应用中仅使用支持度阈值难以有效控制频繁项集的规模.为此定义 N 个最频繁项集挖掘问题,并提出基于...频繁项集挖掘算法的计算复杂性和生成的频繁项集数量随着事务集项数的增加呈指数增长,最小支持度阈值成为控制这种增长的关键.然而,实际应用中仅使用支持度阈值难以有效控制频繁项集的规模.为此定义 N 个最频繁项集挖掘问题,并提出基于支持度阈值动态调整策略的宽度优先搜索算法 NApriori 和深度优先搜索算法IntvMatrix 挖掘 N 个最频繁项集.实验表明,本文的2种方法的效率比朴素方法高2倍以上,特别当 N 值较低时,本文方法的效率优势更为明显.展开更多
文摘频繁项集挖掘算法的计算复杂性和生成的频繁项集数量随着事务集项数的增加呈指数增长,最小支持度阈值成为控制这种增长的关键.然而,实际应用中仅使用支持度阈值难以有效控制频繁项集的规模.为此定义 N 个最频繁项集挖掘问题,并提出基于支持度阈值动态调整策略的宽度优先搜索算法 NApriori 和深度优先搜索算法IntvMatrix 挖掘 N 个最频繁项集.实验表明,本文的2种方法的效率比朴素方法高2倍以上,特别当 N 值较低时,本文方法的效率优势更为明显.