-
题名大规模图挖掘算法并行化研究
- 1
-
-
作者
陈琳
赵政文
李强
-
机构
西北工业大学计算机学院
西北工业大学软件与微电子学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2012年第9期3465-3469,3474,共6页
-
基金
国家自然科学基金项目(60803043
60873196
+1 种基金
61033007)
国家863高技术研究发展计划基金项目(2009AA01A404)
-
文摘
目前大规模图挖掘算法的思路是基于MapReduce将矩阵与向量相乘的过程并行化,但却没有针对MapReduce特点对图数据进行划分,会产生大量中间结果,算法代价较高。针对这些问题,提出了GIM-V LI算法。该算法采用数据划分思想,将图矩阵横向划分,结合MapReduce特点以行为单位替代点或块的数据组织方式,并设计出<key,value>结构,使一个单位数据仅产生一个中间结果,从而大大减少了中间结果,提高了算法的性能。通过大量实验分析验证了该改进算法的正确性与有效性。
-
关键词
大规模图挖掘
矩阵与向量相乘
数据划分
MAPREDUCE
gim-vli
-
Keywords
large scale graph mining
matrix-vector multiplication
data partition
MapReduce
gim-v li
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-