基于深度学习的稀疏矩阵向量乘运算性能预测模型被引量：3

Computing Performance Prediction Model for Sparse Matrix Vector Multiplication Based on Deep Learning

下载PDF

导出

摘要稀疏矩阵向量乘(SpMV)是求解稀疏线性方程组的计算核心,被广泛应用在经济学模型、信号处理等科学计算和工程应用中,对于SpMV及其调优技术的研究有助于提升解决相关领域问题的运算效率。传统SpMV自动调优方法基于硬件平台的体系结构参数设置来提升SpMV性能,但巨大的参数设置量导致搜索空间变大且自动调优耗时大幅增加。采用深度学习技术,基于卷积神经网络,构建由双通道稀疏矩阵特征融合以及稀疏矩阵特征与体系结构特征融合组成的SpMV运算性能预测模型,实现快速自动调优。为提高SpMV运算时间的预测精度,选取特征数据并利用箱形图统计SpMV时间信息,同时在佛罗里达稀疏矩阵数据集上进行实验设计与验证,结果表明,该模型的SpMV运算时间预测准确率达到80%以上,并且具有较强的泛化能力。 Sparse Matrix Vector Multiplication(SpMV)is key to solving sparse linear equations.It is widely used in economic modeling,signal processing and other scientific and engineering tasks.The research on SpMV and its tuning technology can improve the computational efficiency of solving problems in related fields.Traditional SpMV automatic tuning methods improve the performance of SpMV based on the architecture parameter settings of the hardware platform,but the huge amount of parameter settings leads to a larger search space and a significant increase in the time consumption of automatic tuning.To implement fast and accurate automatic tuning,we use deep learning technology to construct a Convolutional Neural Network(CNN)model for SpMV computing performance prediction,which is built based on dual-channel sparse matrix feature fusion,sparse matrix feature fusion and architecture feature fusion.In order to improve the prediction accuracy of SpMV computing performance,feature data is selected and constructed.The box plot is used to count SpMV time information.Then the Florida sparse matrix dataset is selected for experimental design and verification.Experimental results show that the model displaying a prediction accuracy of SpMV computing time over 80%and strong generalization ability.

作者曹中潇冯仰德王珏闵维潇姚铁锤高岳王丽华高付海 CAO Zhongxiao;FENG Yangde;WANG Jue;MIN Weixiao;YAO Tiechui;GAO Yue;WANG Lihua;GAO Fuhai(Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190,China;University of Chinese Academy of Sciences,Beijing 100049,China;School of Software,Beihang University,Beijing 100191,China;China Institute of Atomic Energy,Beijing 102413,China)

机构地区中国科学院计算机网络信息中心中国科学院大学北京航空航天大学软件学院中国原子能科学研究院

出处《计算机工程》 CAS CSCD 北大核心 2022年第2期86-91,共6页 Computer Engineering

基金国家重点研发计划(2017YFB0202302)。

关键词稀疏矩阵向量乘自动调优深度学习卷积神经网络特征融合 Sparse Matrix Vector Multiplication(SpMV) automatic tuning deep learning Convolutional Neural Network(CNN) feature fusion

分类号 TP332 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献3

1李亿渊,薛巍,陈德训,王欣亮,许平,张武生,杨广文.稀疏矩阵向量乘法在申威众核架构上的性能优化[J].计算机学报,2020,43(6):1037-1051. 被引量：13
2袁娥,张云泉,刘芳芳,孙相征.SpMV的自动性能优化实现技术及其应用研究[J].计算机研究与发展,2009,46(7):1117-1126. 被引量：15
3李佳佳,张秀霞,谭光明,陈明宇.选择稀疏矩阵乘法最优存储格式的研究[J].计算机研究与发展,2014,51(4):882-894. 被引量：10

二级参考文献38

1袁伟,张云泉,孙家昶,李玉成.国产万亿次机群系统NPB性能测试分析[J].计算机研究与发展,2005,42(6):1079-1084. 被引量：13
2Vuduc Wilson.Automatic Performance of Sparse Matrix Kernels[D].Berkeley,CA:University of California,2003.
3Im Eun Jin,Yelick Katherine.Optimizing sparse matrix computations for register reuse in SPARSITY[G] //LNCS 2073,Proc of the Int Conf on Computational Science.Berlin,Springer,2001,127-136.
4Im Eun Jin,Yelick Katherine,Vudue Wilson.Sparsity,Optimization framework for fparse matrix kernels[J].International Journal of High Performance Computing Applications,2004,18(1):135-158.
5Vuduc Wilson,Demmel James,Yelick Katherine,et al.Performance optimizarions and bounds for sparse matrixvector multiply[C] //Proc of Supercomputing.Los Alamitos,CA:IEEE Computer Society,2002= 1-35.
6Vuduc Wilson,Demmel James,Bilmes Jeff.Statistical models for empirical search-based performance tuning[J].International Journal of High Performance Computing Applications,2004,18(1):65-94.
7Demmel James,Yelick Katherine.Berkeley Benchmarking and OPtimization Project[OL].2006 [2007-11-20],http:// bebop.cs.berkeley.edu/.
8Voduc Wilson,Demmel James,Yelick Katherine.OSKI,A library of automatically tuned sparse matrix kernels[C] //Proc of SciDAC 2005:Journal of Physics,Conference Series.Philadelphia,PA:IOP,2005:521-530.
9Davis Tim.University of Florida sparse matrix collection[OL].2006[2007-11-20].http://www.else.ufl.edu/ research/sparse/matrices/.
10张云泉.面向数值计算的并行计算模型DRAM(h.k)[C]//863计划智能计算机主题学术会议论文集:智能计算机研究进展.北京,清华大学出版社,2001:218-225.

共引文献33

1孙相征,张云泉,王宣强,王磊.数值软件自适应性能优化搜索过程评价技术研究[J].计算机研究与发展,2010,47(4):679-686. 被引量：2
2陆平静,李宝,车永刚,庞征斌.一种基于代码隔离的大程序迭代编译优化方法[J].上海交通大学学报,2013,47(1):133-137.
3许彬彬,戴清平,朱敏,谢端强.基于哈夫曼编码的稀疏矩阵的存储与计算[J].计算机工程与科学,2013,35(11):134-138. 被引量：3
4罗红兵,张晓霞,王伟,武林平.科学计算应用程序单核指令级优化研究[J].计算机研究与发展,2014,51(6):1263-1269. 被引量：4
5阳王东,李肯立,石林.一种准对角矩阵的混合压缩算法及其与向量相乘在GPU上的实现[J].计算机科学,2014,41(7):290-296. 被引量：5
6刘芳芳,杨超.一种提高SpMV向量化性能的新型稀疏矩阵存储格式[J].数值计算与计算机应用,2014,35(4):269-276. 被引量：4
7阳王东,李肯立.准对角矩阵与向量相乘在CPU+GPU异构集群上的实现与优化[J].小型微型计算机系统,2015,36(7):1659-1664. 被引量：2
8陆平静,李宝,易任娇,张英,王绍刚,庞征斌.一种基于改进模拟退火算法的程序性能优化参数搜索算法[J].计算机工程与科学,2015,37(7):1227-1232. 被引量：5
9陶袁,祝明发.多核及众核体系结构下线性代数算法研究进展[J].吉林师范大学学报（自然科学版）,2015,36(3):32-40.
10黄敏,丁萍,罗海飚.共轭梯度法在GPU及Xeon Phi下的并行优化及比较[J].华南理工大学学报（自然科学版）,2015,43(11):35-46. 被引量：1

同被引文献19

1李佳佳,张秀霞,谭光明,陈明宇.选择稀疏矩阵乘法最优存储格式的研究[J].计算机研究与发展,2014,51(4):882-894. 被引量：10
2刘芳芳,杨超,袁欣辉,吴长茂,敖玉龙.面向国产申威26010众核处理器的SpMV实现与优化[J].软件学报,2018,29(12):3921-3932. 被引量：12
3张玉州.“数据结构”课程中稀疏矩阵运算器的实现[J].安庆师范大学学报（自然科学版）,2017,23(1):98-101. 被引量：1
4程凯,田瑾,马瑞琳.基于GPU的高效稀疏矩阵存储格式研究[J].计算机工程,2018,44(8):54-60. 被引量：9
5谈兆年,计卫星,Akrem Benatia,高建花,李安民,王一拙.面向异构计算平台的SpMV划分优化算法研究[J].计算机工程与科学,2019,41(4):590-597. 被引量：2
6杨世伟,蒋国平,宋玉蓉,涂潇.基于GPU的稀疏矩阵存储格式优化研究[J].计算机工程,2019,45(9):23-31. 被引量：6
7李亿渊,薛巍,陈德训,王欣亮,许平,张武生,杨广文.稀疏矩阵向量乘法在申威众核架构上的性能优化[J].计算机学报,2020,43(6):1037-1051. 被引量：13
8吴志勇,王晞阳,陈继林.一种基于FPGA并行加速的稀疏矩阵求解方法[J].电力系统保护与控制,2021,49(11):155-162. 被引量：7
9顾越,赵银亮.基于RISC-V向量指令的稀疏矩阵向量乘法实现与优化[J].计算机工程与科学,2022,44(1):1-8. 被引量：6
10郑慧敏,郑明洁,张振宁,申晓天.基于低秩和一维稀疏矩阵分解的多通道SAR-GMTI方法[J].中国科学院大学学报（中英文）,2022,39(2):208-216. 被引量：1

引证文献3

1许春荣,买买提依明·哈斯木.案例教学模式下的稀疏矩阵的概念与应用[J].电脑迷,2023(17):79-81.
2张萱,高义,王松兴,朱明彪,桂志平,杨卫良.基于XGBoost算法的铜杆性能检测研究[J].山西冶金,2024,47(8):221-223.
3黄旭东,洪泽,陈振娇.稀疏矩阵在C66x上的应用及优化[J].电子技术应用,2024,50(11):23-27.

1田浩.自动调优技术在智慧校园数据库的应用与优化[J].湖南邮电职业技术学院学报,2021,20(4):26-29. 被引量：2
2杜金柱,卢学峰,陈熠.起落架突伸缓冲器的设计与验证[J].航空科学技术,2022,33(1):76-82. 被引量：4
3李浩,方伟泉,李浪浪,陈学永.基于深度学习的松材线虫病害松木识别[J].林业工程学报,2021,6(6):142-147. 被引量：22
4顾越,赵银亮.基于RISC-V向量指令的稀疏矩阵向量乘法实现与优化[J].计算机工程与科学,2022,44(1):1-8. 被引量：6
5Janette.佛罗里达乐园[J].初中生,2021(27):68-73.
6唐怀奎,李珊珊.ARINC659总线测试系统设计[J].河南科技,2021,40(25):16-20.
7怜青.热钱涌入大宅,富豪也追风[J].看世界,2022(1):21-24.
8任守志,商红军,贾文文,管帅,郑树杰,姚迪,王宁.二维展开太阳翼地面展开试验装置设计与验证[J].航天器工程,2022,31(1):56-63.
9张晖.矿山水文地质特征及涌水量预测--以甘肃尚家沟金矿为例[J].中国金属通报,2021(22):185-186.
10肖文光,金东勇.星载SAR波控系统设计与验证[J].太赫兹科学与电子信息学报,2021,19(4):666-671. 被引量：1

计算机工程

2022年第2期

浏览历史

内容加载中请稍等...

基于深度学习的稀疏矩阵向量乘运算性能预测模型被引量：3

参考文献3

二级参考文献38

共引文献33

同被引文献19

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于深度学习的稀疏矩阵向量乘运算性能预测模型 被引量：3

参考文献3

二级参考文献38

共引文献33

同被引文献19

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于深度学习的稀疏矩阵向量乘运算性能预测模型被引量：3