异或逻辑GPU算法的性能分析与优化

Performance analysis and optimization for XOR GPU algorithm

下载PDF

导出

摘要对机器学习领域内非线性机器学习中的异或逻辑问题进行了深入探讨和分析,并阐述了该算法相应的并行实现方法。之后,通过在主流的Nvidia GPU Kepler架构上进行实际测试以及性能分析工具的使用,确定了该类机器学习算法的主要性能瓶颈。在此基础上,对该算法的最主要的性能瓶颈仿函数进行了优化。从数学理论上推导出了仿函数等价的变换公式并给出了新的计算模式。运用新的计算方法可以大幅度的减少关键路径上的计算量,最终得到了3.5倍的性能提高。 The machine learning algorithm of nonlinear XOR method is explored and analyzed in this paper and then we present the related parallel implementations.After that,we identified the performance bottleneck by testing on the popular hardware of NVIDIA＇s GPU of Kepler architecture and applying performance analysis tools to this kind of machine learning algorithm.Based on analysis results,we optimized the kernel function which also is the major performance bottleneck.Furthermore,the new mathematic formula and computational model are developed so that it can reduce lots of computations in critical path compared with original algorithm.Finally,more than 3.5X speedup are gained by using our proposal.

作者丁大虎

机构地区北方民族大学网络信息技术中心

出处《电子测量技术》 2014年第3期47-50,共4页 Electronic Measurement Technology

关键词机器学习 Nelder-Mead方法异或逻辑 GPU并行计算 machine learning Nelder-Mead method XOR GPU parallel computing

分类号 TP2 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献14

1黎林,朱军.基于小波分析与神经网络的语音端点检测研究[J].电子测量与仪器学报,2013,27(6):528-534. 被引量：26
2李莉.基于小波和神经网络的导弹故障诊断方法[J].电子测量技术,2011,34(4):100-102. 被引量：7
3王万成,张媛.神经网络逆软测量方法的拓展及在生物浸出过程中的应用[J].仪器仪表学报,2012,33(3):661-669. 被引量：7
4ROBF.高性能CUDA应用设计与开发[M].北京:机械工业出版社,2013.
5NVIDIA. http ://www. nvidia, cn/object/what-is gpu- computing-cn, htm.
6连远锋,赵琰,何晖光,吴发林.基于GPU加速的并行脑皮层重建算法研究[J].仪器仪表学报,2013,34(4):866-872. 被引量：5
7NVIDIA. CUDA C Programming Guide,2012. JARED H., NATHAN B., THRAST. A Parallel Template libraryEZ：. 2010, http ://thrust. github, io.
8NELDER, JOHN A., R. M. A simplex method for function minimization[-JJ. Computer Journal 7 : 308- 313. 1965.
9POWELL, MICHAEL J. D. On Search Directions [or Minimization Algorithms[-J：. Mathematical Programming 4: 193-201,1973.
10MCKINNON, K. I. M. Convergence of the Nelde： Mead simplex method to a non-stationary pointEJ3. SIAM J Optimization 9 : 148-158. 1999.

二级参考文献64

1罗积军,侯素霞,赵晓铭,何俊发.基于BP神经网络的电路故障诊断方法[J].国外电子测量技术,2003,22(6):22-23. 被引量：1
2刘锋,夏春先,黄振和.基于人工神经网络的故障诊断专家系统[J].国外电子测量技术,2004,23(4):34-36. 被引量：20
3戴先中,殷铭,王勤.传感器动态补偿的神经网络逆系统方法[J].仪器仪表学报,2004,25(5):593-596. 被引量：26
4常玉清,邹伟,王福利,毛志忠.基于支持向量机的软测量方法研究[J].控制与决策,2005,20(11):1307-1310. 被引量：18
5吴杰,赵锐.固体介质电磁参数自动测试系统[J].国外电子测量技术,2006,25(4):43-45. 被引量：1
6罗志增,王飞.以小波系数为特征值的Pi-sigma网络识别肌电信号[J].测试技术学报,2006,20(4):344-348. 被引量：3
7朴春俊,马静霞,徐鹏.带噪语音端点检测方法研究[J].计算机应用,2006,26(11):2685-2686. 被引量：10
8周春桂,王剑,谢石林,朱长春,张希农.基于神经网络的复杂系统杂交建模研究[J].测试技术学报,2007,21(1):75-78. 被引量：2
9田社平,赵阳,韦红雨,王志武.基于BP神经网络的传感器非线性补偿[J].测试技术学报,2007,21(1):84-89. 被引量：10
10DE ASSIS A J,FILHO R M.Soft sensors development for on-line bioreactor state estimation[J].Computers and Chemical Engineering,2000,24(2-7):1099-1103.

共引文献50

1孙辉,张建华,韩松伟,宋玉龙.基于正交小波变换的海面目标快速检测[J].仪器仪表学报,2015,36(S01):68-72. 被引量：1
2唐凯,苏越.基于连续小波变换的振动故障分析方法研究[J].国外电子测量技术,2011,30(6):18-20. 被引量：11
3敬人可,李建增.混合编程在实时超声无损检测中的应用[J].国外电子测量技术,2012,31(6):63-66. 被引量：5
4敬人可,李建增,周海林.聚类分析在缺陷分类中的应用[J].国外电子测量技术,2012,31(10):55-58. 被引量：10
5张川,张齐军.动态神经网络对功率放大器的建模方法及要点[J].电子测量技术,2014,37(1):96-99. 被引量：2
6蒋彦,刘国海,赵文祥,瞿沥.基于TD-NNLI的永磁同步电机转速辨识[J].电机与控制学报,2014,18(2):62-68. 被引量：3
7丁世敬,黄刘宏,李跃波,贾超,郭士旭,杨吉祥,闫民华.宽带扫频RCS自动测量系统设计[J].电子测量技术,2014,37(5):61-63. 被引量：4
8汤媛媛,周海芳,方民权,申小龙.基于GPU的高光谱遥感影像数据处理[J].信息安全与技术,2015,6(4):46-51. 被引量：4
9张猛,姜田,冯一军.阻抗型频率选择表面电磁吸波结构的设计及测量[J].电子测量技术,2014,37(8):7-9. 被引量：3
10刘国权,马栋良,杨大峰,魏亚星.炭黑对无机开孔泡沫吸波材料反射率的影响[J].光电技术应用,2014,29(4):17-20.

1邹丹萍,陈炜浩.CUDA平台下B显显示处理实现方法[J].江苏科技信息,2015,32(20):73-74.
2王涛,王勇.一种引入Nelder-Mead算子的改进狼群搜索算法[J].计算机应用研究,2016,33(10):2937-2940. 被引量：2
3王世昌.异或逻辑性质及伽罗华域算术运算的逻辑实现[J].光学精密工程,1996,4(4):125-129.
4海量显存盈通GTX760-4096GD5游戏高手显卡[J].电脑迷,2014(5):16-16.
5李隆.索泰GTX Titan隆重登场[J].电脑爱好者,2013(6):73-73.
6全新7系列旗舰震撼来袭[J].电脑迷,2013(6):24-24.
7晶合实验室,魔之左手.魔术双风扇——微星N650 Power Edition显卡[J].大众软件,2012(21):10-11.
8王阔.欢迎移动版Kepler“GTX”! NVIDIA GeForce GTX 660M现身[J].微型计算机,2012(19):127-127.
9张夷捷.修改BIOS、提升超频性能KePler显卡“软改”实战[J].微型计算机,2013(3):140-148.
10radinlove.NVIDIA Kepler GPU 性能预测与分析[J].微型计算机,2012(4):105-108.

电子测量技术

2014年第3期

浏览历史

内容加载中请稍等...

异或逻辑GPU算法的性能分析与优化

参考文献14

二级参考文献64

共引文献50

相关作者

相关机构

相关主题

浏览历史