用户频繁通信关系的并行挖掘算法研究被引量：1

Parallel Algorithm for Mining User Frequent Communication Relationship

下载PDF

导出

摘要随着移动通信技术和互联网的飞速发展,移动通信设备已经成为大多数人随身携带的工具,这些设备之间因互相通信而产生的数据构成了通信网络。文中提出了一种针对海量通信数据的频繁通信子图并行挖掘算法PMFCS。该算法在频繁项目集挖掘思想和子图连接规则的基础上,利用并行计算框架Spark将所有的图以边为单位分布到各个计算节点,在各个节点统计1阶候选频繁子图,再通过汇总候选子图得到1阶频繁子图。PMFCS算法通过迭代地连接k-1阶子图和1阶子图生成k阶候选子图,再计算k阶候选子图的频繁度,直至k阶频繁子图集合为空集。实验结果表明,该算法可以快速、有效地解决频繁通信关系的挖掘问题。 With the rapid development of mobile communication technology and Internet,mobile communication equipment has become a portable tool for most people.A parallel algorithm PMFCS was proposed for mining frequent communication sub-graph of mass communication data.The algorithm is based on the Apriori algorithm and sub-graph connect principle.It uses Spark to distribute all the edges to each computing node,then the 1 th-order frequent candidate sub-graphs are distributed to each node,the 1 th-order frequent candidate sub-graphs are counted at each node,and the1 th-order sub-graphs are got by summarizing candidate sub-graphs.PMFCS iteratively connects the（k-1）th-order subgraph and the 1 th-order sub-graph to generate kth-order candidate sub-graphs.Subsequently,the algorithm terminates until the kth-order frequent sub-graph set is empty.The experimental results show that PMFCS can mine the frequent communication sub-graph efficiently and quickly.

作者朱鹏宇鲍培明吉根林

机构地区南京师范大学计算机科学与技术学院

出处《计算机科学》 CSCD 北大核心 2018年第2期103-108,共6页 Computer Science

基金国家自然科学基金项目:云计算环境下顾及用户关系的手机用户时空轨迹模式挖掘方法研究(41471371)资助

关键词通信网络频繁子图频繁通信关系 Communication network Frequent sub-graph Frequent communication relationship

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1汪卫,周皓峰,袁晴晴,楼宇波,施伯乐.基于图论的频繁模式挖掘[J].计算机研究与发展,2005,42(2):230-235. 被引量：17
2李先通,李建中,高宏.一种高效频繁子图挖掘算法[J].软件学报,2007,18(10):2469-2480. 被引量：35

二级参考文献29

1Rakesh Agrawal, Ramakrishnan Srikant. Fast algorithms for mining association rules in large databases. VLDB1994, Santiago,Chile, 1994.
2Heikki Mannila, et al. Search and borders of theories in knowledge discovery. Data Mining and Knowledge Discovery,1997, 1(3): 241～258.
3Jong Soo Park, et al. An effective Hash based algorithm for mining association rules. SIGMOD1995, San Jose, USA, 1995.
4Sergey Brin, et al. Dynamic itemset counting and implication rules for market basket data. SIGMOD1997, Tucson, USA,1997.
5Ramesh C. Agarwal, et al. Depth first generation of long patterns, KDD 2000, Boston, USA, 2000.
6Ramesh C. Agarwal, et al. A tree projection algorithm for generation of frequent itemsets. J. of Parallel and Distributed Computing, 2001, 61(3): 350～371.
7Jiawei Han, Jian Pei, Yiwen Yin. Mining frequent patterns without candidate generation. SIGMOD2000, Dallas, USA, 2000.
8J. Pei, et al.. H-Mine: Hyper-structure mining of frequent patterns in large databases. ICDM'01, San Jose, CA, 2001.
9Mike Perkowitz, Oren Etzioni. Adaptive sites: Automatically learning from user access patterns. WWW' 97, Santa Clara, 1997.
10J. Pei, et al.. PrefixSpan: Mining sequential patterns efficiently by prefix-projected pattern growth. ICDE'01, Heidelberg, 2001.

共引文献45

1鲁慧民,冯博琴,宋擒豹.频繁子图挖掘研究综述[J].微电子学与计算机,2009,26(3):156-161. 被引量：1
2詹宇斌,殷建平,张玲,龙军,程杰仁.一种基于有向树挖掘Web日志中最大频繁访问模式的方法[J].计算机应用,2006,26(7):1662-1665. 被引量：9
3陈亮,高建民,李青,陈琨.基于频繁活动序列挖掘的过程改进机会分析[J].西安交通大学学报,2006,40(11):1310-1314. 被引量：1
4刘勇,李建中,朱敬华.一种新的基于频繁闭显露模式的图分类方法[J].计算机研究与发展,2007,44(7):1169-1176. 被引量：10
5吴卫江,李国和.一种基于极大连通子图的电信社群网分割算法[J].计算机工程与应用,2008,44(5):8-9. 被引量：2
6王涛.一种基于频繁子树的数据库索引方法[J].华中科技大学学报（自然科学版）,2008,36(3):103-106.
7高琳,覃桂敏,周晓峰.图数据中频繁模式挖掘算法研究综述[J].电子学报,2008,36(8):1603-1609. 被引量：9
8周军,姜元春,林文龙.基于有向带权图的Web用户浏览行为模型[J].情报理论与实践,2008,31(5):795-798. 被引量：1
9吴甲,陈崚.一种快速的频繁子图挖掘算法[J].计算机应用,2008,28(10):2533-2536. 被引量：4
10付立东,赵永刚,邓福岐.二维非线性对流扩散方程求解程序优化[J].西安科技大学学报,2009,29(1):104-108.

同被引文献8

1谢玓,尚学群,王淼,张延园.解决数据样本不平衡性的频繁子图挖掘算法[J].计算机工程与应用,2008,44(36):146-149. 被引量：5
2雷珂,何威.基于数据挖掘技术的软件缺陷检测方法研究[J].电子世界,2012(15):112-114. 被引量：2
3张成虎,尹为.基于数据流频繁子图挖掘的可疑金融交易动态识别[J].系统工程,2013,31(7):1-7. 被引量：4
4屠黎阳,杜俊强,接标,张道强.基于判别性子图重构的轻微肝性脑病分类[J].模式识别与人工智能,2016,29(9):832-839. 被引量：3
5李龙洋,董一鸿,严玉良,陈华辉,钱江波.Spark环境下基于频繁边的大规模单图采样算法[J].计算机研究与发展,2017,54(9):1966-1978. 被引量：3
6肖飞,王悦,梅逸男,白璐,崔丽欣.基于出行模式子图的城市功能区域发现方法[J].计算机科学,2018,45(12):268-278. 被引量：5
7朱雪冰,周安民,左政.基于家族行为频繁子图挖掘的恶意代码检测[J].信息安全研究,2019,5(2):105-113. 被引量：3
8彭绍亮,牛琦,李肯立,邹权.CPU-MIC异构并行架构下基于大规模频繁子图挖掘的药物发现算法[J].大数据,2019,5(2):89-103. 被引量：2

引证文献1

1吴成凤.频繁子图挖掘算法的应用分类[J].电脑知识与技术,2020,16(29):40-41.

1张桂英.考前抓基础更有效[J].中学生导报.高考政治,2009,0(2):7-7.
2张孝梅.善于变式——数学思维训练的有效途径[J].延边教育学院学报,2017,31(5):81-84. 被引量：3
3王小刚.综合实践活动中学生问题意识的培养[J].科普童话（新课堂）,2017,0(30):77-77.
4周鹏,熊运余.异构网络中基于频繁子图检测的关系预测算法[J].计算机工程与设计,2017,38(10):2623-2630.
5张森.大数据时代的计算机网络安全及防范措施探析[J].网络安全技术与应用,2018(1):55-55. 被引量：51
6孙卓霖.针对VPN在移动通信数据核心网的应用[J].中国新通信,2018,20(2):118-118.
7曾俊.一种基于Hadoop架构的并行挖掘算法研究[J].现代电子技术,2018,41(1):117-119. 被引量：13
8孙玮谦.浅谈高中数学学习的预习方法[J].赢未来,2017(14):124-124.
9赵景伟.挖掘思想品德教材内容,培养健康发展人才[J].新课程（中学）,2017,0(2):78-78.
10廖婧,余浩然.吉登斯结构化理论视角下黔东南苗族银饰发展研究[J].广西师范学院学报（哲学社会科学版）,2017,38(6):79-86. 被引量：1

计算机科学

2018年第2期

浏览历史

内容加载中请稍等...

用户频繁通信关系的并行挖掘算法研究被引量：1

参考文献2

二级参考文献29

共引文献45

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

用户频繁通信关系的并行挖掘算法研究 被引量：1

参考文献2

二级参考文献29

共引文献45

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

用户频繁通信关系的并行挖掘算法研究被引量：1