-
题名标签集约束近似频繁模式的并行挖掘
被引量:7
- 1
-
-
作者
郑海雁
王远方
熊政
李昆明
崇志宏
尹飞
-
机构
江苏方天电力技术有限公司智能电网产品中心
东南大学计算机科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2015年第9期135-141,共7页
-
基金
国家自然科学基金(No.60973023)
-
文摘
近似频繁模式衍生于频繁模式,综合了频繁项集与频繁子图的特点。针对该模式的研究集中在无标签图上,其应用场景主要为社交网络、语义网络、智能电网等。近似频繁模式挖掘过程同时涉及频繁项集挖掘和频繁子图挖掘,因此已有的处理频繁模式挖掘算法无法较好地解决近似频繁模式挖掘问题。基于近似频繁模式结构,将其拓展到带标签图中,引入标签集约束,并设计标签集约束近似频繁模式挖掘算法LCPP(Label-Constraint Proximity Pattern),该算法并行部署在Map Reduce计算模型中,弥补了开源p FP算法处理大规模数据时效率不高的缺点。实验结果验证了该算法的有效性和可扩展性,表明了LCPP算法是p FP算法的极佳补充。
-
关键词
近似频繁模式
标签集约束
并行化
-
Keywords
proximity
label-constraint
parallel
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-