该文针对电力大数据环境下正负关联规则挖掘项集多和运算量大的问题,提出了并行正负关联规则挖掘算法,即MR-CEPNR(MapReduce-based Closed set Eclat Positive and Negative Rules)。该算法基于数据分块思想,利用关联规则中的闭集特性...该文针对电力大数据环境下正负关联规则挖掘项集多和运算量大的问题,提出了并行正负关联规则挖掘算法,即MR-CEPNR(MapReduce-based Closed set Eclat Positive and Negative Rules)。该算法基于数据分块思想,利用关联规则中的闭集特性将大数据集划分成小数据块,在每个数据块中挖掘正负频繁项集。第一步,Map过程读取数据集将其划分为小数据块,Reduce过程在每个小数据块上计算频繁2-项集并保存;第二步,Map过程根据频繁2-项集制作分发表,Reduce过程根据分发表和频繁2-项集来计算频繁K(K>2)-项集。算法结果表明,该算法可以对电力大数据中隐藏的正负关联规则进行有效挖掘,并提供决策方案。展开更多
文摘该文针对电力大数据环境下正负关联规则挖掘项集多和运算量大的问题,提出了并行正负关联规则挖掘算法,即MR-CEPNR(MapReduce-based Closed set Eclat Positive and Negative Rules)。该算法基于数据分块思想,利用关联规则中的闭集特性将大数据集划分成小数据块,在每个数据块中挖掘正负频繁项集。第一步,Map过程读取数据集将其划分为小数据块,Reduce过程在每个小数据块上计算频繁2-项集并保存;第二步,Map过程根据频繁2-项集制作分发表,Reduce过程根据分发表和频繁2-项集来计算频繁K(K>2)-项集。算法结果表明,该算法可以对电力大数据中隐藏的正负关联规则进行有效挖掘,并提供决策方案。