基于Spark的L_1-BC算法在关键蛋白质检测中的应用

Application of L_1-BC algorithm based on Spark in key proteins detection

下载PDF

导出

摘要 Spark作为当今大数据领域的分布式处理框架,在各个领域的应用越来越广泛。在关键蛋白质预测中,基于蛋白质相互作用网络拓扑结构的介数中心(BC)指标有着很好的预测效果,提出一种新的L_1-BC指标,不仅能区分一些BC指标值相同的蛋白质,还能通过取子图计算体现出蛋白质的局部特性,实验结果表明该指标能够提高关键蛋白质的预测精度。基于Spark平台实现了L_1-BC指标的并行计算算法,通过累加器和广播变量使得内存得到极大的优化,在数据集YDIP上的实验结果表明,基于Spark的L_1-BC算法的加速比达到了94.31%。 Spark is widely used in various fields as a distributed processing framework in big data field. For the key protein prediction in Protein-Protein Interaction （PPI） networks, the Betweermess Centrality （BC） which is based on the topology properties of PPI networks has a good prediction effect. In this paper, a new index called L1-BC is presented, which not only distinguishes some proteins with the same values of BC index, but also reflects the local properties of proteins. The experimental results show that the index L1-BC can improve the accuracy of key proteins prediction. In addition, the parallel computing algorithm of L1-BC is implemented based on Spark platform, in which the memory is greatly optimized by utilizing accumulator and broadcast variable. The results of acceleration ratio experiment on the dataset YDIP show that the optimized L1-BC algorithm on the Spark can reach the acceleration ratio of 94.31%.

作者胡德祺孙永奇秦朝 HU Deqi;SUN Yongqi;QIN Chao(School of Computer and Information Technology,Beijing Jiaotong University,Beijing 100044,China)

机构地区北京交通大学计算机与信息技术学院

出处《计算机工程与应用》 CSCD 北大核心 2018年第24期234-240,共7页 Computer Engineering and Applications

基金国家自然科学基金(No.61572005 No.61672086 No.61272004)

关键词 SPARK 分布式计算关键蛋白质检测介数中心性 Spark distributed computing key proteins prediction betweenness centrality

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1李梅,王慧慧.基于并行计算算法的电能质量扰动分类[J].电力系统及其自动化学报,2018,30(4):126-130. 被引量：1
2杨济海,彭汐单,巢玉坚.基于复杂网络的电力通信网拓扑分析与优化[J].计算机与数字工程,2018,46(11):2319-2322. 被引量：4
3邓文齐,郑启龙,盛鑫,杨振浩.分簇架构处理器上卷积并行计算算法的研究[J].小型微型计算机系统,2018,39(3):520-524. 被引量：3
4基因疗法清除帕金森致病蛋白指日可待[J].科学24小时,2018,0(11):34-34.
5苗甫,王振兴,郭毅,张连成,王禹.一种基于级联失效模型的域间路由节点重要性评估方法[J].信息工程大学学报,2018,19(3):358-363.
6辛强伟,唐云凯,许晓婷.无线传感器网络多天线移动式数据收集算法[J].咸阳师范学院学报,2018,33(6):57-62.
7辛强伟,唐云凯,许晓婷.基于虚拟中心点的移动Sink轨迹优化方法[J].中国新通信,2018,20(22):49-49.
8汤伟,刘思洋,高涵,陶倩.基于改进霍夫变换的水面无人船水界线检测方法[J].科学技术与工程,2018,18(31):36-41. 被引量：3
9白周现,胡爽,孔祥东.NR2E3基因纯合新突变致Goldmann-Favre综合征一家系[J].中华眼底病杂志,2018,34(6):541-545. 被引量：1
10孙凯传,苗孟君,杨斌.植物乳杆菌WCFS1和JDM1的糖代谢PPI网络鲁棒性研究[J].湖北工程学院学报,2018,38(6):14-18.

计算机工程与应用

2018年第24期

浏览历史

内容加载中请稍等...

基于Spark的L_1-BC算法在关键蛋白质检测中的应用

相关作者

相关机构

相关主题

浏览历史