摘要
针对传统FP-Growth算法在大规模数据环境下挖掘效率低下的问题,提出了一种改进的FP-Growth算法。该算法主要是通过基于频繁闭项集策略对完备模式树进行剪枝进而减小搜索空间规模,达到提高算法挖掘效率的目的。并将改进后的FP-Growth算法的分治策略与分布式计算框架Hadoop的Map Reduce编程模式有机结合,进一步提高了大数据环境下的挖掘效率。实验证明,基于Hadoop的改进FP-Growth算法的效率较传统FP-Growth算法有所提高。
出处
《电脑知识与技术》
2018年第5Z期1-2,9,共3页
Computer Knowledge and Technology
基金
华侨大学科研基金资助项目(No.13BS415)
泉州市科技计划基金资助项目(No.2014Z112)
福建省自然科学基金资助项目(No.2015J05125)
国家自然科学基金资助项目(No.61372107)