一种基于图形处理器的频繁模式挖掘算法被引量：6

GPU-based frequent pattern mining algorithm

下载PDF

导出

摘要频繁模式挖掘是数据挖掘的核心问题。传统上,频繁模式并行挖掘主要是在集群上进行的,较少涉及共享内存多处理系统上的并行挖掘。基于广度优先搜索和直接计数策略研究了一种并行挖掘方法,并在图形处理器(graphics processing unit,GPU)最新统一计算设备架构CUDA(compute unified device architecture)下进行了实现。GPU-based FPMA用CPU控制搜索进程;在GPU的多处理器上,采用数据划分的计算策略,以适合GPU的顺序数据流方式计数,并根据候选项的长度动态剪枝事务数据集。实验结果表明,GPU-based FPMA比CPU版本平均加速了10倍以上。 Frequent pattern mining is an important issue in data mining area. Traditionally, parallel frequent pattern mining is carried out in PC clusters, and seldom related to multi-processors or massive cores with shared memories. In this paper, we propose a parallel frequent pattern mining algorithm suitable for GPU （graphics processing unit） based on width search and direct support strategy. It is implemented under compute unified device architecture （CUDA） of GPU. In this algorithm, CPU takes charge of search process and GPU is responsible for counting using data partition. In addition, transactions are dynamically pruned according to the length （k） of candidate frequent itemsets. Performance analysis shows that GPU-based FPMA reaches an average speed as fast as that of 10 times of CPU-based counterpart.

作者白洪涛欧阳丹彤何丽莉

机构地区吉林大学计算机科学与技术学院吉林大学符号计算与知识工程教育部重点实验室

出处《仪器仪表学报》 EI CAS CSCD 北大核心 2009年第10期2082-2087,共6页 Chinese Journal of Scientific Instrument

基金国家自然科学基金重大项目(60496320 60496321) 国家自然科学基金(60773097 60873148)资助项目

关键词关联规则频繁模式图形处理器并行计算统一计算设备架构 association rule frequent pattern GPU parallel computing CUDA

分类号 TP311.1 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1林晓勇,朱群雄.频繁模式增量维护算法IM-FPM[J].仪器仪表学报,2008,29(7):1517-1521. 被引量：1
2李忠哗,何丕廉.一种分布环境中最大频繁项目集挖掘算法[J].微电子学与计算机,2006,23(9):162-164. 被引量：1
3汪卫,周皓峰,袁晴晴,楼宇波,施伯乐.基于图论的频繁模式挖掘[J].计算机研究与发展,2005,42(2):230-235. 被引量：17
4吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504. 被引量：141
5刘君强,孙晓莹,王勋,潘云鹤.挖掘最大频繁模式的新方法[J].计算机学报,2004,27(10):1328-1334. 被引量：15

二级参考文献36

1吴恩华,柳有权.基于图形处理器(GPU)的通用计算[J].计算机辅助设计与图形学学报,2004,16(5):601-612. 被引量：227
2陆介平,杨明,孙志挥,鞠时光.快速挖掘全局最大频繁项目集[J].软件学报,2005,16(4):553-560. 被引量：27
3阮幼林,李庆华,刘干.分布环境中的并行频繁模式挖掘算法[J].计算机工程与应用,2005,41(25):1-3. 被引量：3
4[1]Agrawal R., Imielinski T., Swami A.. Mining association rules between sets of items in large databases. In: Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data, Washington, D. C. , USA, 1993, 207～216
5[2]Lin D-I. , Kedem Z. M.. Pincer-search: A new algorithm for discovering the maximum frequent set. In: Proceedings of the 6th International Conference on Extending Database Technology, Valencia, Spain, 1998, 105～119
6[3]Bayardo R. J.. Efficiently mining long patterns from databases.In: Proceedings of the 1998 ACM SIGMOD International Conference on Management of Data, Seattle, Washington, USA,1998, 85～93
7[4]Aggarwal C. , Agarwal R. , Prasad V. V. V.. Depth first generation of long patterns. In: Proceedings of the 6th ACM SIGKDD International Conference on Knowledge Discovery ＆ Data Mining, Boston, MA, USA, 2000, 108～118
8[5]Burdick D. , Calimlim M. , Gehrke J.. MAFIA: A maximal frequent itemset algorithm for transactional databases. In: Proceedings of the 17th International Conference on Data Engineering, Heidelberg, Germany, 2001, 443～452
9[6]Agrawal R. , Srikant R.. Fast algorithms for mining association rules. In: Proceedings of the 20th International Conference on Very Large Data Bases, Santiago, Chile, 1994, 487～499
10[7]Liu Jun-Qiang, Pan Yun-He, Wang Ke, Han Jia-Wei. Mining frequent item sets by opportunistic projection. In: Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Alberta, Canada, 2002, 229～238

共引文献170

1刘波,王博亮,谢杰镇.应用于生物膜组织的虚拟手术仿真技术研究[J].中国数字医学,2007,2(11):37-40. 被引量：1
2张军,易成,王邦平,李晓峰.GPU加速的鲁棒性人脸2.5D重建方法[J].四川大学学报（工程科学版）,2009,41(4):155-162.
3刘伟峰,赵改善,孔祥宁,蔡杰雄,张兵.基于多GPU的三维Kirchhoff积分法体偏移[J].华中科技大学学报（自然科学版）,2011,39(S1):110-114.
4刘伟峰,王永胜,张天雷,张兵.使用GPU模拟地震波传播的性能研究[J].系统仿真学报,2009,21(S1):170-174. 被引量：3
5鲍春波,王博亮.基于半边结构的膜组织触觉仿真[J].学术问题研究,2006,0(2):104-109.
6张建勋,刘全利,陈庄.基于可编程GPU的快速体绘制技术[J].重庆大学学报（自然科学版）,2005,28(7):67-70. 被引量：9
7卓贤林,游志胜,李辉.基于数据挖掘的VaR测量算法研究[J].四川大学学报（自然科学版）,2005,42(6):1136-1140.
8柳有权,刘学慧,吴恩华.基于GPU带有复杂边界的三维实时流体模拟[J].软件学报,2006,17(3):568-576. 被引量：54
9方建文,于金辉,马文龙.图形硬件加速的实时水面绘制[J].计算机工程与应用,2006,42(15):86-88. 被引量：2
10李笑盈,吴恩华.过程性纹理映射的FPGA动态生成[J].计算机辅助设计与图形学学报,2006,18(5):630-637. 被引量：1

同被引文献82

1李晓梅,吴建平.Krylov子空间方法及其并行计算[J].计算机科学,2005,32(1):19-20. 被引量：20
2颜跃进,李舟军,陈火旺.一种挖掘最大频繁项集的深度优先算法[J].计算机研究与发展,2005,42(3):462-467. 被引量：20
3王刘芳,王贻平,朱琦,郭守贤,章述汉,向珂.高精度智能型有源大功率直流标准电阻器的研制[J].电测与仪表,2005,42(11):24-26. 被引量：6
4宾雪莲,杨玉海,金士尧.一种基于分组与适当选取策略的实时多处理器系统的动态调度算法[J].计算机学报,2006,29(1):81-91. 被引量：17
5李建国,陈松乔,鲁志辉.实时异构系统的动态分批优化调度算法[J].计算机学报,2006,29(6):976-984. 被引量：13
6张艳君,宋京伟.人脸识别中利用眼球进行人脸归一化[J].北京联合大学学报,2006,20(2):35-39. 被引量：2
7赵劲松,孟晓风.一种ATE开关最短路径搜索算法[J].电子测量与仪器学报,2006,20(3):33-36. 被引量：5
8胡天一,徐中伟.多处理器并行EDPF优化实时调度算法[J].计算机工程与应用,2007,43(19):35-38. 被引量：5
9MALLAT S. A theory for multiresolution signal decom- position:the wavelet representation[J]. IEEE Trans. on Pattern Analysis and Machine Intelligence, 1989, 11(7) :674-693.
10DAUGMAN J. Uncertainty relation for resolution space, spatial frequency and orientation optimized two-dimensional visual cortical filters[J]. Journal the Optical Society of America, 1985 (2) : 1160-1169.

引证文献6

1王斌,王遵彤.基于奖赏因子的改进最小松弛度算法[J].电子测量技术,2011,34(10):27-29. 被引量：1
2杨慧,胡金演,蒋秋峰.基于多尺度Gabor变换的人脸识别算法优化[J].电子测量技术,2011,34(10):41-44. 被引量：5
3李熙铭,欧阳丹彤,白洪涛.基于GPU的混合精度平方根共轭梯度算法[J].仪器仪表学报,2012,33(1):97-104. 被引量：6
4连远锋,赵琰,何晖光,吴发林.基于GPU加速的并行脑皮层重建算法研究[J].仪器仪表学报,2013,34(4):866-872. 被引量：5
5连远锋,赵剡,何晖光.自适应耦合变分模型及其GPU实现[J].仪器仪表学报,2013,34(11):2520-2525. 被引量：1
6徐巧玉,王红梅,王军委,王已伟.基于BFS的高精度无源电阻发生器研究[J].中国测试,2017,43(10):59-64.

二级引证文献18

1孙辉,张建华,韩松伟,宋玉龙.基于正交小波变换的海面目标快速检测[J].仪器仪表学报,2015,36(S01):68-72. 被引量：1
2连远锋,赵琰,何晖光,吴发林.基于GPU加速的并行脑皮层重建算法研究[J].仪器仪表学报,2013,34(4):866-872. 被引量：5
3钱鹰,王矿生,黄颖.用于图像重构的代数多重网格算法[J].计算机工程与设计,2013,34(8):2801-2805. 被引量：1
4连远锋,赵剡,何晖光.自适应耦合变分模型及其GPU实现[J].仪器仪表学报,2013,34(11):2520-2525. 被引量：1
5丁大虎.异或逻辑GPU算法的性能分析与优化[J].电子测量技术,2014,37(3):47-50.
6周正,孙丽萍,姜滨.基于控制体积有限元方法的木材干燥过程含水率分布模型[J].东北林业大学学报,2014,42(4):124-126. 被引量：1
7彭土有.基于GPU-CUDA的共轭斜量法实现及性能对比[J].计算机时代,2014(4):4-6. 被引量：1
8汤媛媛,周海芳,方民权,申小龙.基于GPU的高光谱遥感影像数据处理[J].信息安全与技术,2015,6(4):46-51. 被引量：4
9王睿,陈春晓,刘高,阚星星.基于自适应包围盒划分的体绘制加速方法研究[J].仪器仪表学报,2014,35(11):2560-2566. 被引量：5
10许晓臣,董明利,王君,孙鹏,燕必希.基于CUDA的动态视觉测量像面特征点中心快速定位算法[J].计算机工程与科学,2014,36(12):2378-2385. 被引量：5

1刘彩虹,刘强.向量内积策略的多支持度正负关联规则挖掘[J].计算机工程与应用,2011,47(36):162-165. 被引量：1
2欧策,仲荣法.分级互连多处理器系统[J].电子计算机,1992(6):10-23.
3李学干.多处理机系统的性能分析[J].西安电子科技大学学报,1996,23(1):48-53. 被引量：1
4韩建,田博文,王春龙.基于FPGA的CAN总线网络故障检测修复系统研究[J].化工自动化及仪表,2014,41(9):1040-1042. 被引量：2
5杜铁塔,胡守仁.Transputer在连续系统并行仿真中的应用研究[J].航天控制,1990,8(1):43-49.
6邢二保,周兴铭.私有Cache的选择对紧耦合多处理机系统访存冲突的影响[J].计算机工程,1993,19(3):32-37.
7皮德常,秦小麟,王宁生.基于动态剪枝的关联规则挖掘算法[J].小型微型计算机系统,2004,25(10):1850-1852. 被引量：16
8LI Guiqing,ZHANG ,liahua,LIANG Cheng,YIN Mengxiao,XIONG Yunhui.GPU-based composite subdivision[J].Computer Aided Drafting,Design and Manufacturing,2012,22(3):50-60. 被引量：2
9Sunny.擦亮慧眼看清Intel CPU[J].电子制作．电脑维护与应用,2004(9):59-59.
10刘彩虹,刘强,李爱平.基于向量内积的非频繁项挖掘算法研究[J].计算机工程与科学,2011,33(2):92-96. 被引量：2

仪器仪表学报

2009年第10期

浏览历史

内容加载中请稍等...

一种基于图形处理器的频繁模式挖掘算法被引量：6

参考文献5

二级参考文献36

共引文献170

同被引文献82

引证文献6

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

一种基于图形处理器的频繁模式挖掘算法 被引量：6

参考文献5

二级参考文献36

共引文献170

同被引文献82

引证文献6

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

一种基于图形处理器的频繁模式挖掘算法被引量：6