一种基于CUDA的K-Means多级并行优化方法被引量：1

K-Means Multi-level Parallel Optimization Method Based on CUDA

下载PDF

导出

摘要 K-Means聚类算法是data mining领域中最常用的算法之一.在进行海量数据分析时,K-Means均值聚类的计算时间与其要处理的计算量成正比.因此,数据量越大计算开销也越长.为了提升算法的运算性能,本文设计了一种基于CUDA模型的多级并行的K-Means算法优化方法.将K-Means串行算法并行化,并对并行计算部分进行包括线程块级,线程级,指令级,比特级在内的多级性能优化.首先,在计算样本点与聚类中心距离的核函数中,采用矩阵乘的思想对主要步骤进行并行处理,初步提升算法性能;然后,对核函数的线程块,块中线程数,每线程执行的指令数及比特数进行逐级分析和优化.在合理利用计算资源和存储资源的同时提升算法计算性能,使聚类效果达到最优;最后,通过多项实验对本文方法进行仿真和验证,检验其可行性.结果表明,在保证实验结果准确性的情况下,与其它优化并行算法相比,本文方法最高加速比达到了39.7%,平均加速比达到了22.3%,同时降低了GPU资源占用率. K-means clustering algorithm is one of the most commonly used algorithms in data mining.When performing massive data analysis,the calculation time of K-Means mean clustering is also proportional to the amount of data to be processed,so the larger the amount of data,the greater the calculation.In order to improve the performance of the algorithm,this paper designs a multi-level parallel k-means algorithm optimization method based on CUDA model.Based on serial analysis of the K-Means algorithm,it is modified into a parallel algorithm.And the multi-level performance optimization of the parallel computing part including thread block level,thread level,instruction level,and bit level.First,in the kernel that calculates the distance between the sample points and the cluster center,the idea of matrix multiplication is used to improve the algorithm performance.Then,the block,the number of threads,the number of instructions executed by each thread, and the number of bits are analyzed and optimized step by step.With the reasonable use of computing resources and storage resources,the algorithm s computing performance is increased as much as possible to achieve the optimal clustering effect.Finally,through a number of experiments,the method of this paper is simulated and verified to verify its feasibility.The experimental results show that the optimized algorithm improves the calculation speed while ensuring the accuracy of the experimental results.Compared with the general parallel K-M eans algorithm,the maximum speed-up is 39.1% and average speed-up is 22.3%,while the resource occupancy rate has decreased.

作者方玉玲那丽春 FANG Yu-ling;NA Li-chun(School of Information Managementt,Shanghai Lixin University of Accounting and Finance,Shanghai 201209,China)

机构地区上海立信会计金融学院信息管理学院

出处《小型微型计算机系统》 CSCD 北大核心 2021年第7期1547-1553,共7页 Journal of Chinese Computer Systems

关键词 K-MEANS 并行计算 CUDA 多级并行优化 K-Means parallel computation CUDA multi-level parallel optimization

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1喻新潮,曾圣超,温柳英,罗朝广.一种聚类与kNN结合的协同过滤算法[J].小型微型计算机系统,2019,40(4):755-759. 被引量：10
2彭云,万红新,钟林辉.一种语义弱监督LDA的商品评论细粒度情感分析算法[J].小型微型计算机系统,2018,39(5):978-985. 被引量：12
3周丽娟,王慧,王文伯,张宁.面向海量数据的并行KMeans算法[J].华中科技大学学报（自然科学版）,2012,40(S1):150-152. 被引量：31
4林涛,赵璨.最近邻优化的k-means聚类算法[J].计算机科学,2019,46(S11):216-219. 被引量：27
5唐东凯,王红梅,胡明,刘钢.优化初始聚类中心的改进K-means算法[J].小型微型计算机系统,2018,39(8):1819-1823. 被引量：32
6高见文,薛行贵,罗杰,姜源,吴启武.基于迭代式MapReducede的海量数据并行聚类算法研究[J].中国科技论文,2016,11(14):1626-1631. 被引量：6
7王法玉,刘志强.Spark框架下分布式K-means算法优化方法[J].计算机工程与设计,2019,40(6):1595-1600. 被引量：12

二级参考文献49

1Ekanayake J,Pallickara S.MapReduce for data in-tensive scientific analysis. IEEE eScience . 2008
2Zhou Ping,Lei Jingsheng,Ye Wenjun.Large-scaledata sets clustering based on MapReduce and hadoop. Journal of Computational Information Systems . 2011
3Hadoop:Open source implementation of MapReduce. http:∥hadoop.apache.org . 2010
4Wang Xuan.Clustering in the cloud:clustering algo-rithms to Hadoop Map/Reduce framework. . 2010
5DEAN J,GHEMAWAT S.MapReduce:simplified data processing on large clusters. . 2004
6Ekanayake J,Pallickara S.MapReduce for data in-tensive scientific analysis. IEEE eScience . 2008
7Zhou Ping,Lei Jingsheng,Ye Wenjun.Large-scaledata sets clustering based on MapReduce and hadoop. Journal of Computational Information Systems . 2011
8Hadoop:Open source implementation of MapReduce. http:∥hadoop.apache.org . 2010
9Wang Xuan.Clustering in the cloud:clustering algo-rithms to Hadoop Map/Reduce framework. . 2010
10DEAN J,GHEMAWAT S.MapReduce:simplified data processing on large clusters. . 2004

共引文献123

1韩静.基于智慧养老模式下的老年助听器用户体验影响因素分析[J].科技经济导刊,2020,0(2):195-196.
2廖国庆,吴文海,曾鑫鹏.YOLOv4与ORB深度融合的绝缘子识别定位研究[J].电子测量与仪器学报,2022,36(2):131-138. 被引量：5
3顾唐杰,秦波,蒋小菲.一种基于改进型Chameleon算法的宿舍分配方法[J].智能计算机与应用,2022,12(5):23-30.
4於贤德.中国古代生态文化的思想源流[J].嘉兴高等专科学校学报,2000,13(1):9-14. 被引量：3
5余文礼.基于聚类分析和贪心算法的文件碎片拼接复原[J].电子世界,2014(11):183-183.
6赵硕,张少敏.分布式电力负荷预测算法研究[J].小型微型计算机系统,2014,35(8):1856-1860. 被引量：4
7李尧坤.面向数据规模可扩展的并行优化K-means算法[J].现代计算机（中旬刊）,2015(1):3-5.
8郭峰,张珣.家庭背景音乐系统大数据的分析[J].物联网技术,2015,5(7):92-95.
9邹云峰,梅飞,李悦,程云,涂旺,梅军.基于数据挖掘技术的台区合理线损预测模型研究[J].电力需求侧管理,2015,17(4):25-29. 被引量：43
10张东香,江长柱.基于多重语义的词典管理方法和实现[J].信息技术,2015,39(9):191-195.

同被引文献6

1韩学涛,梁富,孙洪波,王超,何彩霞.基于多相滤波的通用数字信道化技术[J].现代雷达,2018,40(10):62-66. 被引量：4
2杨科,张之江.基于CUDA架构的有向距离函数三维重建[J].工业控制计算机,2019,32(7):90-91. 被引量：1
3李辉,岳田.非均匀多载波信道分路技术的FPGA设计方法[J].无线电工程,2019,49(8):674-677. 被引量：1
4蒋文斌,刘湃,陈雨浩,张杨松.基于CUDA流技术的深度学习系统优化[J].华中科技大学学报（自然科学版）,2020,48(7):107-111. 被引量：3
5赵文超,黄伟,李翔,侯改利.基于多相滤波的软件无线电接收机[J].通信技术,2021,54(6):1514-1520. 被引量：1
6朱志辉,夏禹涛,王力东,刘禹兵.基于GPU的车辆-轨道-地基土耦合系统3D随机振动并行计算方法[J].湖南大学学报（自然科学版）,2021,48(7):79-88. 被引量：2

引证文献1

1胡杰,刘凯.基于GPU的部分抽取信道化并行实现[J].工业控制计算机,2022,35(6):116-118.

1罗利.Hadoop集群实现词频统计应用[J].网络安全技术与应用,2021(6):64-65. 被引量：1
2郝帅,孙才志,宋强敏.中国能源-粮食生产对水资源竞争的关系——基于水足迹的视角[J].地理研究,2021,40(6):1565-1581. 被引量：20
3陈泽.基于格密码的矩阵乘可验证计算方案[J].现代计算机,2021,27(16):84-87. 被引量：1
4张尧,吴成茂,白鹭.基于特征选取的局部模糊聚类算法研究[J].光电技术应用,2021,36(3):35-42. 被引量：3
5陈鑫峰,王武.稀疏对称矩阵的LDL^(T)分解在GPU上的高效实现[J].数据与计算发展前沿,2021,3(3):136-147. 被引量：1
6谭肖.让爱车省油的五个诀窍[J].石油知识,2021(1):20-20.
7邓军勇,赵一迪.图计算中遍历类图框架的特性[J].西安邮电大学学报,2021,26(2):35-41.
8李维唐,任佳骏,帅志刚.含时密度矩阵重正化群的理论与应用[J].高等学校化学学报,2021,42(7):2085-2102.
9陈剑,张志华,伍乙生,傅志铭.大数据技术在高校智慧校园建设中的应用[J].微型电脑应用,2021,37(7):79-81. 被引量：11
10郝帅,孙才志,宋强敏.基于ESTDA模型的中国水生态足迹及水生态压力评价[J].生态学报,2021,41(12):4651-4662. 被引量：19

小型微型计算机系统

2021年第7期

浏览历史

内容加载中请稍等...

一种基于CUDA的K-Means多级并行优化方法被引量：1

参考文献7

二级参考文献49

共引文献123

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于CUDA的K-Means多级并行优化方法 被引量：1

参考文献7

二级参考文献49

共引文献123

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于CUDA的K-Means多级并行优化方法被引量：1