复杂属性条件下基于Spark的clique社区搜索算法

Spark-based clique Community Search Algorithm Under Complex Attribute Condition

下载PDF

导出

摘要现有的社区搜索算法难以在网络中找到满足给定复杂属性条件的社区。同时,随着网络规模的不断扩大,单机串行的社区搜索算法也已无法有效地处理大规模的网络数据。针对复杂属性条件下的clique社区搜索问题,提出一种基于Spark的搜索算法。在Spark并行计算框架的基础上,结合图的结构特征和内容属性,根据由布尔表达式定义的复杂属性条件采取不同的搜索策略,搜索时利用属性的搜索成本和扩展成本进行局部优化,从而加快搜索过程。实验结果表明,与结构优先或属性优先的社区搜索算法相比,该算法在不同属性条件、网络规模和节点数目的情况下均能保证搜索准确性并提高搜索效率。 Existing community search algorithms often fail to find the communities that satisfy the given complex attribute conditions in networks.At the same time,single-machine serial community search algorithms are not capable of processing massive network data generated by scaling networks.To address the problem,this paper proposes a Spark-based community search algorithm under complex attribute condition.The algorithm is constructed by using the parallel computing framework of Spark.Based on the structural features and content attributes of the graph,different search strategies are used according to the complex attribute conditions defined by Boolean expressions.The search cost and extension cost of the attribute are used for partial optimization to speed up the search process.Experimental results show that compared with the proposed structure-first community search algorithm and attribute-first community search algorithm,the proposed algorithm displays a higher search efficiency with the accuracy ensured in the cases of different network scales,numbers of nodes,and attribute conditions.

作者佘鑫何震瀛 SHE Xin;HE Zhenying(Software School,Fudan University,Shanghai 200441,China;School of Computer Science,Fudan University,Shanghai 200441,China)

机构地区复旦大学软件学院复旦大学计算机科学技术学院

出处《计算机工程》 CAS CSCD 北大核心 2021年第12期54-61,70,共9页 Computer Engineering

基金国家重点研发计划“精准公共法律服务支撑技术与装备研究”(2018YFC0830900)。

关键词社区搜索复杂属性条件布尔表达式 Spark并行计算框架 clique结构 community search complex attribute condition Boolean expression Spark parallel computing framework clique structure

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1付饶,孟凡荣,邢艳.基于节点重要性与相似性的重叠社区发现算法[J].计算机工程,2018,44(9):192-198. 被引量：5
2卢志刚,吴露.ESN中基于贪婪派系扩张的重叠社区发现[J].计算机工程,2019,45(7):32-40. 被引量：2
3竺俊超,王朝坤.复杂条件下的社区搜索方法[J].软件学报,2019,30(3):552-572. 被引量：12

二级参考文献16

1邓小龙,王柏,吴斌,杨胜琦.基于信息熵的复杂网络社团划分建模和验证[J].计算机研究与发展,2012,49(4):725-734. 被引量：15
2武志昊,林友芳,Steve Gregory,万怀宇,田盛丰.Balanced Multi-Label Propagation for Overlapping Community Detection in Social Networks[J].Journal of Computer Science & Technology,2012,27(3):468-479. 被引量：40
3潘磊,金杰,王崇骏,谢俊元.社会网络中基于局部信息的边社区挖掘[J].电子学报,2012,40(11):2255-2263. 被引量：28
4黄发良,张师超,朱晓峰.基于多目标优化的网络社区发现方法[J].软件学报,2013,24(9):2062-2077. 被引量：30
5朱牧,孟凡荣,周勇.基于链接密度聚类的重叠社区发现算法[J].计算机研究与发展,2013,50(12):2520-2530. 被引量：34
6石梦雨,周勇,邢艳.基于LeaderRank的标签传播社区发现算法[J].计算机应用,2015,35(2):448-451. 被引量：13
7刘世超,朱福喜,甘琳.基于标签传播概率的重叠社区发现算法[J].计算机学报,2016,39(4):717-729. 被引量：59
8宋俐,谢刚,杨云云.基于模糊聚类的社团划分算法[J].计算机工程,2016,42(8):126-133. 被引量：6
9李磊,倪林.基于模块度优化的标签传播社区发现算法[J].计算机系统应用,2016,25(9):212-215. 被引量：11
10单菁,申德荣,寇月,聂铁铮,于戈.基于重叠社区搜索的传播热点选择方法[J].软件学报,2017,28(2):326-340. 被引量：9

共引文献16

1陈文杰.融合节点主题特征的社团发现研究[J].情报理论与实践,2021,44(5):153-158. 被引量：1
2李举,马慧芳,李青青,宿云.融合结构-属性交互二部图随机游走的社区搜索方法[J].计算机工程与科学,2021,43(6):1067-1075.
3陈文杰,文奕,杨宁.基于节点向量表示的模糊重叠社区划分算法[J].数据分析与知识发现,2021,5(5):41-50. 被引量：2
4李青青,马慧芳,李举,李志欣.属性网络中相似性增强随机游走的多社区搜索[J].电子学报,2021,49(11):2096-2100. 被引量：1
5顾天凯,王朝坤,楼昀恺.时序网络中短时社区搜索方法研究[J].计算机学报,2022,45(2):334-353. 被引量：2
6李晓红,王闪闪,周学铭,宿云.结合拓扑势与信任度调整的重叠社区发现算法[J].计算机工程,2022,48(5):53-58.
7刘继,贾芳弟.基于圈结构的LPANNI优化算法[J].计算机应用研究,2022,39(9):2717-2722. 被引量：1
8李占利,李颖,罗香玉,罗颖骁.基于Monte-Carlo迭代求解策略的局部社区发现算法[J].计算机应用,2023,43(1):104-110.
9王亚峰,周丽华,陈伟,王丽珍,陈红梅.异质信息网络的互信息最大化社区搜索[J].浙江大学学报（工学版）,2023,57(2):287-298.
10苏立伟,陈海燕,谭火超,方霆.基于模糊谱聚类的电力客服智能问答系统[J].信息技术,2023,47(1):120-125.

1马慧芳,胡东林,刘宇航,李志欣.融合作者合作强度与研究兴趣的合作者推荐[J].计算机工程与科学,2021,43(10):1864-1872.
2杨洪音,王钊,董丰收.基于西门子S120的拉矫机电气控制系统设计[J].工业控制计算机,2020,33(1):42-43. 被引量：2
3李天坤,黄锦海,许琛琛,陈海丝,李坤珂,王勤美,高蓉蓉.国人版角膜接触镜配戴者生活质量量表的研制与评估[J].中华眼视光学与视觉科学杂志,2020,22(2):111-118. 被引量：1
4陈恒恒,倪志伟,朱旭辉,金媛媛,陈千.基于聚类分析的差分隐私高维数据发布方法[J].计算机应用,2021,41(9):2578-2585. 被引量：6
5王才伟.论巨灾债券的保险法规制[J].华北电力大学学报（社会科学版）,2021(4):74-81.
6顾韩.长视频永无宁日[J].东西南北,2021(20):70-71.
7常欣,郭宏.数据确权的困境与解决路径[J].法制博览（名家讲坛、经典杂文）,2021(30):71-72. 被引量：2
8梁一帆,占小红.基于共词分析的国内外中学化学教材研究述评[J].化学教学,2021(11):13-20. 被引量：1
9Aming Liu,Tongsuo Wu.A Construction of Sequentially Cohen-Macaulay Graphs[J].Algebra Colloquium,2021,28(3):399-414. 被引量：1
10Zheng HUO,Ping HE,Lisha HU,Huanyu ZHAO.DP-UserPro:differentially private user profile construction and publication[J].Frontiers of Computer Science,2021,15(5):197-206.

计算机工程

2021年第12期

浏览历史

内容加载中请稍等...

复杂属性条件下基于Spark的clique社区搜索算法

参考文献3

二级参考文献16

共引文献16

相关作者

相关机构

相关主题

浏览历史