动态任务分配CUDA线程束步进体绘制被引量：4

Volume Rendering Using Dynamic CUDA Warp Marching

下载PDF

导出

摘要针对标准CUDA光线投射体绘制过程中因线程束内线程计算量不均产生线程束分化,导致计算资源利用率低的问题,提出CUDA线程束步进的算法.首先分析标准CUDA实现导致线程束分化的原因,提出将光线积分映射至线程束上,线程束内所有线程同步分段积分直至光线终止,以避免线程束分化;然后结合光线积分的数学原理和GPU的硬件特性提出线程束内光线积分的算法;最后针对静态线程束任务分配方式导致负载失衡的缺点,提出动态线程束任务分配的实现算法.实验结果表明,动态任务分配线程束步进算法的性能较标准CUDA实现可获得1.9～7.9倍的加速效果. A CUDA warp marching method for ray casting volume rendering is proposed to address the problem of low computational resource utilization resulted from warp divergence due to irregular workload for each thread in a warp. We firstly analyzed the reasons for warp divergence in standard CUDA implementation. Warp divergences are eliminated by integrating each single ray with all the threads in a warp, which executes instructions in lock-step. The algorithm of integrating one single ray within one warp is introduced after detailing the mathematical principles and GPU hardware specifications. Dynamic work scheduling strategy is also incorporated into warp marching to further improve the overall performance by better balancing the workloads of streaming multi-processors. Experimental results indicate that our dynamic warp marching method can achieve 1.9-7.9 times speedup as compared with standard CUDA implementation.

作者孙万捷高瞻潘海燕王杰华蒋峥峥

机构地区南通大学电子信息学院南通大学计算机科学与技术学院南通大学附属医院心血管内科

出处《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2016年第10期1630-1638,共9页 Journal of Computer-Aided Design & Computer Graphics

基金国家自然科学基金(61170171) 南通市科技计划项目(BK2014067 BK2014064)

关键词 CUDA 线程束体绘制资源利用率 CUDA warp volume rendering resources utilization

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1Kajiya J T, Von Herzen B P. Ray tracing volume densities[C] //Proceedings of the 11th Annual Conference on ComputerGraphics and Interactive Techniques. New York: ACM Press,1984: 165-174.
2Engel K, Hadwiger M, Kniss J M, et al. Real-time volumegraphics[M]. Wellesely: A K Peters, Ltd, 2006: 163-185.
3钟灿,赵俊,张丹枫.基于GPGPU的实时结肠虚拟展平技术[J].计算机辅助设计与图形学学报,2011,23(2):263-269. 被引量：2
4Kruger J, Westermann R. Acceleration techniques for GPUbasedvolume rendering[C] //Proceedings of the IEEE Visualization.Los Alamitos: IEEE Computer Society Press, 2003:287-292.
5秦绪佳,王建奇,朱思达,郑红波,徐晓刚.基于GPU的四维医学图像动态快速体绘制[J].计算机辅助设计与图形学学报,2011,23(11):1789-1798. 被引量：13
6解立志,周明全,田沄,赵世凤.基于光线投射算法的脑血管体绘制技术[J].系统仿真学报,2012,24(9):1864-1867. 被引量：7
7LUO Yanhong,TIAN Jun,LUO Yanlin.Interactively Inspection Layers of CT Datasets on CUDA-Based Volume Rendering[J].Chinese Journal of Electronics,2015,24(2):355-360. 被引量：2
8Kumar P, Agrawal A. CUDA based interactive volume renderingof 3D medical data[M] //Intelligent Interactive Technologiesand Multimedia. Heidelberg: Springer, 2013, 276: 123-132.
9Fangerau J, Kr-mker S. Parallel volume rendering implementationon graphics cards using CUDA[M] //Facing the Multicore-Challenge. Heidelberg: Springer, 2010, 6310: 143-153.
10Wang J, Yang F, Cao Y. Computation-to-core mapping strategiesfor iso-surface volume rendering on GPUs[C] //Proceedingsof IEEE Pacific Visualization Symposium, 2015. LosAlamitos: IEEE Computer Society Press, 2015: 153-157.

二级参考文献61

1储璟骏,杨新,高艳.使用GPU编程的光线投射体绘制算法[J].计算机辅助设计与图形学学报,2007,19(2):257-262. 被引量：33
2Winawer S J. Colorectal cancer screening [J]. Best Practice Research Clinical Gastroenterology, 2007, 21 (6) : 1031-1048.
3Johnson C D, Dachman A H. CT colonography: the next colon screening examination? [J]. Radiology, 2000, 216(2): 331-341.
4Hong L, Muraki S, Kaufman A, et al. Virtual voyage: interactive navigation in the human colon [C]//Computer Graphics Proceedings, Annual Conference Series, ACM SIGGRAPH. New York: ACM Press, 1997: 27-34.
5Bartroli A V, Wegenkittl R, Konig A, et al. Virtual colon flattening [C] //Proceedings of Joint Eurographics-IEEE TCVG Symposium on Visualization. Washington D C: IEEE Computer Society Press, 2001:127-136.
6Ahn H, Shin B S. Height-based deformation and ray supersampling for colon unfolding [C] //Proceedings of the 16th International Conference on Artificial Reality and Telexistenee. Berlin: Springer, 2006, 4282:1098-1107.
7Stegmaier S, Strengert M, Klein T, et al. A simple and flexible volume rendering framework for graphics-hardwarebased raycasting [C]//Proceedings of the 4th International Workshop on Volume Graphics. Washington D C: IEEE Computer Society Press, 2005:187-241.
8Shin B S, Lira S, Lee H J. Efficient unfolding of Virtual endoscopy using linear ray interpolation [J]. Computer Methods and Programs in Biomedicine, 2009, 93(2) : 174-184.
9Lim S, Lee H J, Shin B S. Surface reconstruction for efficient colon unfolding [C]//Proceedings of the 4th International Conference on Geometric Modeling and Processing. Berlin: Springer, 2006, 4077:623-629.
10Luebke D, Harris M, Govindaraju N, et al. GPGPU: general-purpose computation on graphics hardware [C] // Proceedings of ACM/IEEE Conference on Supercomputing. New York: ACM Press, 2006: Article No. 208.

共引文献19

1张滢,冯筠,赵翊凯,康宝生,贺小伟.结肠中心线快速提取算法研究[J].计算机辅助设计与图形学学报,2013,25(3):381-389. 被引量：1
2曾文权,胡玉贵,余爱民.一种基于非透明度校正的光线投射体绘制算法[J].科学技术与工程,2013,21(10):2867-2870.
3刘金明,王宽全.基于GPU光线投射算法的心脏体数据三维可视化[J].计算机应用,2013,33(9):2662-2666. 被引量：2
4吕晓琪,张传亭,任国印,张宝华.基于图形处理器的肺部及病灶区域四维可视化技术[J].中国医学影像技术,2013,29(11):1901-1905. 被引量：2
5王大龙.基于C#的动态图形显示设计与实现探讨[J].软件,2013,34(11):96-97. 被引量：4
6贺承浩,金西,郑琳琳,刘子恒,王浩原.时变数据的实时体绘制加速算法优化[J].计算机辅助设计与图形学学报,2014,26(2):314-319. 被引量：1
7方孝荣,王南飞,张建锋,龚向阳,刘飞,何勇.基于核磁共振的玉米根系3维可视化研究[J].浙江大学学报（农业与生命科学版）,2014,40(2):181-187.
8方军,房晓阳,肖亮.基于包围跳跃的计算统一设备架构光线投射算法[J].科学技术与工程,2014,22(12):245-249.
9冯晓萌,吴玲达,董士伟.CUDA加速的动态电磁环境数据场实时绘制[J].系统仿真学报,2014,26(9):2044-2049. 被引量：6
10李佩峰,杨震.三维地磁场体数据实时可视化方法研究[J].电子设计工程,2015,23(3):43-46.

同被引文献20

1柳有权,刘学慧,吴恩华.基于GPU带有复杂边界的三维实时流体模拟[J].软件学报,2006,17(3):568-576. 被引量：54
2孙涛,韩善清,汪家旺.PET/CT成像原理、优势及临床应用[J].中国医学物理学杂志,2010,27(1):1581-1582. 被引量：76
3尚朝轩,韩宁,董健,张大伟.合作空间目标双基地ISAR图像畸变分析及校正方法[J].电讯技术,2012,52(1):38-42. 被引量：2
4田立坤,刘晓宏,李洁.BP神经网络用于大视场显示设备的畸变校正[J].电光与控制,2012,19(12):43-46. 被引量：3
5丁立军,冯浩,华亮.Clifford代数3D人脸姿态矫正方法[J].小型微型计算机系统,2013,34(4):906-909. 被引量：6
6田丰,夏雪,田晶,张文俊,王鹤.高分辨真三维显示中的体素化及均匀化方法[J].计算机辅助设计与图形学学报,2013,25(9):1304-1311. 被引量：2
7董现玲,丁有得,江贵平.基于曲率的保留上下文传递函数设计[J].中国医学物理学杂志,2013,30(4):4289-4293. 被引量：3
8王耀东,余祖俊,石井抱.高速立体视觉与机械运动异常动作三维检测[J].仪器仪表学报,2013,34(10):2161-2169. 被引量：15
9刘超,李醒飞,郭敬滨,谭文斌.基于共线点的镜头畸变校正方法[J].计算机应用,2013,33(12):3555-3558. 被引量：6
10孔令胜,刘春雨,张元,金光.视差自由立体显示中莫尔条纹消除的研究进展[J].液晶与显示,2014,29(3):441-449. 被引量：10

引证文献4

1郭全,王雷,杨利素,张胜男.基于拓扑分析的交互式体绘制系统[J].山东理工大学学报（自然科学版）,2019,33(1):56-59.
2刘海玲.基于计算机视觉算法的图像处理技术[J].计算机与数字工程,2019,47(3):672-677. 被引量：21
3夏松竹,杨静,方宝辉,徐金秀.基于GPU异构平台的实时CT图像重建系统的研究[J].计算机应用研究,2019,36(6):1879-1882. 被引量：5
4魏德凯,曾赛.宽带STMV波束形成算法的GPU并行优化实现[J].声学与电子工程,2022(3):16-19.

二级引证文献26

1汪琛龙.基于计算机视觉算法的图像处理技术的研究[J].郑铁科技,2020,0(1):26-28. 被引量：1
2崔茜.基于计算机视觉算法的图像处理技术的研究[J].计算机产品与流通,2020,0(5):111-111. 被引量：2
3汪先超,张勇,戴瑜.体素投影分类ART算法快速重建CT图像[J].核电子学与探测技术,2022,42(6):1058-1062.
4汪新超.办公室自动化的计算机处理技术应用分析[J].神州,2019,0(18):250-250.
5陈宏君,谢建民.基于计算机视觉算法的图像处理技术的研究[J].吉林广播电视大学学报,2019(10):158-160. 被引量：6
6李亚丽,张国平.计算机视觉算法的图像处理技术研究[J].电脑编程技巧与维护,2019,0(12):148-149. 被引量：1
7汪琛龙.基于计算机视觉算法的图像处理技术的研究[J].大众标准化,2020,2(7):53-54. 被引量：3
8于红彬,夏彬,王泽武.基于图像处理的棉花表面杂质自动识别[J].上海纺织科技,2020,48(6):17-19. 被引量：4
9张冰,郭立川,宋欣,张媛,白晶.疫情期间入院人员信息登记系统的研究与实现[J].信息系统工程,2020,33(7):94-95. 被引量：1
10赵男.基于图像处理技术的中国画色彩修复系统设计[J].现代电子技术,2020,43(17):60-63. 被引量：5

1陈乐.CUDA处理机管理机制分析[J].福建电脑,2010,26(8):29-29.
2杨志昱,张旭东.基于集成众核的高性能计算软件优化[J].电子技术与软件工程,2014(21):80-80. 被引量：1
3李之玉,刘勃,归琳,张文军.Ad-hoc网络的大步进节点发现算法[J].信息安全与通信保密,2011,9(4):40-43. 被引量：1
4王杨,石翠.结构化对等网络的负载均衡问题研究[J].信息技术与信息化,2014(12):44-45.
5张锐,万海军,王安华.基于分段积分的PID控制方法的研究[J].自动化技术与应用,2013,32(8):1-2. 被引量：6
6袁红星,吴少群,朱仁祥,诸葛霞.平面单应性矩阵求解的CUDA并行实现[J].微型机与应用,2012,31(23):38-41. 被引量：2
7陈国军,牛玉美,申宝明.多视图像的三维重建并行计算仿真平台[J].系统仿真学报,2012,24(1):72-75. 被引量：2
8刘雯卿,陈春晓,陆丽娜.GPU加速的光线投射体绘制工具包设计[J].中国医疗器械杂志,2009,33(5):356-359.
9徐恭学,李玉忱.一种优化的光线投射体绘制采样算法[J].厦门大学学报（自然科学版）,1997,36(1):27-32. 被引量：3
10杨汉明,李霞.Sparc T4：动态线程服务器芯片[J].高性能计算技术,2013,0(3):35-40.

计算机辅助设计与图形学学报

2016年第10期

浏览历史

内容加载中请稍等...

动态任务分配CUDA线程束步进体绘制被引量：4

参考文献16

二级参考文献61

共引文献19

同被引文献20

引证文献4

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

动态任务分配CUDA线程束步进体绘制 被引量：4

参考文献16

二级参考文献61

共引文献19

同被引文献20

引证文献4

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

动态任务分配CUDA线程束步进体绘制被引量：4