主流数据挖掘算法不能有效解决大规模数值数据集挖掘问题。提出了一种应用于大规模数值数据集改进的线性时间封闭项集挖掘(improved linear time closed item sets mining,ILCM)算法。ILCM算法使用能够提取属性共同变化量的渐进模式挖...主流数据挖掘算法不能有效解决大规模数值数据集挖掘问题。提出了一种应用于大规模数值数据集改进的线性时间封闭项集挖掘(improved linear time closed item sets mining,ILCM)算法。ILCM算法使用能够提取属性共同变化量的渐进模式挖掘方法,借鉴LCM算法的前缀保留闭合扩展思想,通过深度优先搜索输出频繁封闭渐进项集结果。实验证明,相比传统挖掘算法,ILCM能够显著提高算法运行效率和降低内存空间占用;并且能够有效处理如DNA微阵列等实际大型数值数据集挖掘。展开更多
文摘主流数据挖掘算法不能有效解决大规模数值数据集挖掘问题。提出了一种应用于大规模数值数据集改进的线性时间封闭项集挖掘(improved linear time closed item sets mining,ILCM)算法。ILCM算法使用能够提取属性共同变化量的渐进模式挖掘方法,借鉴LCM算法的前缀保留闭合扩展思想,通过深度优先搜索输出频繁封闭渐进项集结果。实验证明,相比传统挖掘算法,ILCM能够显著提高算法运行效率和降低内存空间占用;并且能够有效处理如DNA微阵列等实际大型数值数据集挖掘。