期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
OpenMP与环形缓冲技术在TFT-LCD缺陷检测中的应用 被引量:3
1
作者 胡海兵 徐挺 +3 位作者 张波 徐东建 金施群 卢荣胜 《计算机科学》 CSCD 北大核心 2019年第S11期562-566,共5页
针对TFT-LCD玻璃基板缺陷检测过程中数据流量大、数据处理流程复杂、数据输入输出时序性要求高等问题,文中提出了一种使用环形缓冲和Open MP的多线程并行处理方法。该方法利用Open MP技术来实现复杂的多核并行处理,以达到充分利用多核... 针对TFT-LCD玻璃基板缺陷检测过程中数据流量大、数据处理流程复杂、数据输入输出时序性要求高等问题,文中提出了一种使用环形缓冲和Open MP的多线程并行处理方法。该方法利用Open MP技术来实现复杂的多核并行处理,以达到充分利用多核处理器资源来提高数据处理能力的目的。同时,该方法在缺陷数据输入、数据处理、数据输出等流程中,利用环形缓冲技术进行数据分流,从而实现多线程并行处理与实时稳定输出。将该方法应用到实时缺陷检测系统中,使检测系统的处理速度提高了约2~3倍,数据输出时间误差降低了70%~80%,这充分表明了该方法的实用性和有效性。 展开更多
关键词 并行处理 缺陷检测 open mp 环形缓冲
下载PDF
Intel多核与集成众核上CFD程序的OpenMP性能分析 被引量:2
2
作者 车永刚 张理论 +2 位作者 王勇献 徐传福 程兴华 《计算机科学与探索》 CSCD 北大核心 2015年第10期1153-1162,共10页
多核与众核已成为当前主流的高性能计算体系结构,Open MP编程是开发其并行计算能力的主要手段之一。针对一个实际高阶精度结构网格CFD(computational fluids dynamics)应用程序,采用基于硬件计数器的性能测试和模型分析的方法,系统地研... 多核与众核已成为当前主流的高性能计算体系结构,Open MP编程是开发其并行计算能力的主要手段之一。针对一个实际高阶精度结构网格CFD(computational fluids dynamics)应用程序,采用基于硬件计数器的性能测试和模型分析的方法,系统地研究了其在Intel Xeon E5 Sandy Bridge多核处理器和Intel Knights Corner集成众核协处理器上的Open MP性能。重点分析了Open MP库开销、线程负载均衡性、主存访问带宽对性能的影响,发现因Open MP并行引入的冗余计算对并行效率影响很小,但串行计算部分和负载不均衡性对并行效率影响大,主存访问带宽对浮点性能的影响大。还比较了该程序两种体系结构上的性能差异,讨论了性能进一步优化的方向。 展开更多
关键词 多核 集成众核 CFD应用程序 open mp 性能分析
下载PDF
Open-MP与并行程序设计 被引量:2
3
作者 陈峻 陈宏建 秦玲 《计算机科学》 CSCD 北大核心 2003年第11期133-135,共3页
1引言 随着并行处理技术的发展,并行计算已日益成为现代科学与工程计算必不可少的工具.工作站机群(COW)以及大规模并行处理机(MPP)的发展与应用使得并行计算向高性能、可扩放、通用性发展.
关键词 mpI 并行程序设计
下载PDF
An efficient large-scale mesh deformation method based on MPI/Open MP hybrid parallel radial basis function interpolation 被引量:4
4
作者 Zhong ZHAO Rong MA +2 位作者 Lei HE Xinghua CHANG Laiping ZHANG 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 2020年第5期1392-1404,共13页
An efficient MPI/OpenMP hybrid parallel Radial Basis Function (RBF) strategy for both continuous and discontinuous large-scale mesh deformation is proposed to reduce the computational cost and memory consumption.Unlik... An efficient MPI/OpenMP hybrid parallel Radial Basis Function (RBF) strategy for both continuous and discontinuous large-scale mesh deformation is proposed to reduce the computational cost and memory consumption.Unlike the conventional parallel methods in which all processors use the same surface displacement and implement the same operation,the present method employs different surface points sets and influence radius for each volume point movement,accompanied with efficient geometry searching strategy.The deformed surface points,also called Control Points (CPs),are stored in each processor.The displacement of spatial points is interpolated by using only 20-50 nearest control points,and the local influence radius is set to 5-20 times the maximum displacement of control points.To shorten the searching time for the nearest control point clouds,an Alternating Digital Tree (ADT) algorithm for 3D complex geometry is designed based on an iterative bisection technique.Besides,an MPI/OpenMP hybrid parallel approach is developed to reduce the memory cost in each High-Performance Computing (HPC) node for large-scale applications.Three 3D cases,including the ONERA-M6 wing and a commercial transport airplane standard model with up to 2.5 billion hybrid elements,are used to test the present mesh deformation method.The robustness and high parallel efficiency are demonstrated by a wing deflection case with a maximum bending angle of 450 and more than 80% parallel efficiency with 1024 MPI processors.In addition,the availability for both continuous and discontinuous surface deformation is verified by interpolating the projecting displacement with opposite directions surface points to the spatial points. 展开更多
关键词 Mesh deformation Moving mesh generation mpI/open mp hybrid parallel computing Parallel radial basis function interpolation Unstructured hybrid grid
原文传递
探地雷达频率域2.5维正演 被引量:5
5
作者 戴世坤 欧阳振崇 +5 位作者 周印明 张钱江 李昆 赵东东 陈轻蕊 凌嘉宣 《电子与信息学报》 EI CSCD 北大核心 2021年第1期145-153,共9页
该文从频率域电磁法满足的控制方程出发,采用有限单元法实现了频率域2.5维探地雷达(GPR)正演模拟。重点分析了波数域电磁场谱随相对介电常数和收发距变化的规律,探讨了2.5维GPR正演模拟的波数选取问题;基于Open MP并行算法与串行算法的... 该文从频率域电磁法满足的控制方程出发,采用有限单元法实现了频率域2.5维探地雷达(GPR)正演模拟。重点分析了波数域电磁场谱随相对介电常数和收发距变化的规律,探讨了2.5维GPR正演模拟的波数选取问题;基于Open MP并行算法与串行算法的计算效率对比,表明频率域2.5维GPR数值模拟方法具有高效率、高精度和高度并行性的特点,为雷达正演提供重要理论参考依据和技术支撑,是GPR全波形反演的重要基础。 展开更多
关键词 探地雷达 正演 2.5维 频率域 波数选取 open mp 并行
下载PDF
建立电力系统状态空间方程的并行方法 被引量:2
6
作者 王克文 冶梦雨 刘艳红 《郑州大学学报(工学版)》 CAS 北大核心 2021年第1期15-20,共6页
为了缩减大规模电力系统小干扰稳定性分析的计算时间,对电力系统状态空间矩阵的快速形成方法进行优化研究。针对插入式建模技术,分析状态矩阵的形成过程;采用含双重阈值的不完全LU分解法(ILUTP),调整相关矩阵中非零元素的位置,将矩阵转... 为了缩减大规模电力系统小干扰稳定性分析的计算时间,对电力系统状态空间矩阵的快速形成方法进行优化研究。针对插入式建模技术,分析状态矩阵的形成过程;采用含双重阈值的不完全LU分解法(ILUTP),调整相关矩阵中非零元素的位置,将矩阵转换为对角占优形式。采用双共轭梯度稳定法(BICGSTAB)对处理后的大型稀疏矩阵迭代求解;矩阵的存储方式为行压缩稀疏存储;利用ILUTP与BICGSTAB的算法特性,实现了基于Open MP技术的并行计算;利用两个分别包含23台发电机和98台发电机的算例,发电机均采用六阶发电机模型,励磁调节模块与原动机调速块均为系统的实际参数,对比传统方法与优化方法求解状态矩阵方法的所用时间。结果表明,该方法能够加快大型电力系统状态空间的形成过程,其并行加速比接近于3,验证了所提方法的可行性及有效性。 展开更多
关键词 状态矩阵 双共轭梯度稳定法 不完全LU分解 行压缩存储 open mp
下载PDF
锥束CT图像重建算法的快速实现 被引量:4
7
作者 吴胜利 潘瑞谊 文斌 《CT理论与应用研究(中英文)》 2007年第4期31-37,共7页
本文基于锥束CT滤波反投影重建的FDK算法,通过两种算法改进并结合基于共享内存的OpenMP并行技术和代码优化,实现了锥束CT图像的快速重建。基于锥束CT实际投影数据的重建结果表明,图像重建速度得到了较大的提高,断层图像重建质量与FDK原... 本文基于锥束CT滤波反投影重建的FDK算法,通过两种算法改进并结合基于共享内存的OpenMP并行技术和代码优化,实现了锥束CT图像的快速重建。基于锥束CT实际投影数据的重建结果表明,图像重建速度得到了较大的提高,断层图像重建质量与FDK原型算法相当。 展开更多
关键词 锥束CT 图像重建 FDK滤波反投影法 openmp并行技术
下载PDF
适用于混合网格的改进雅可比迭代法及其应用 被引量:1
8
作者 黄宇 阎超 袁武 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2016年第3期551-561,共11页
LU-SGS因有较高的鲁棒性和小的内存需求而得到广泛应用,然而用于混合网格计算前需要进行网格排序和分组来实现算法并行;此外,LU-SGS格式收敛效率不高。针对这些缺点,本文提出了一种改进的适用于复杂混合网格的雅可比迭代方法,无需网格... LU-SGS因有较高的鲁棒性和小的内存需求而得到广泛应用,然而用于混合网格计算前需要进行网格排序和分组来实现算法并行;此外,LU-SGS格式收敛效率不高。针对这些缺点,本文提出了一种改进的适用于复杂混合网格的雅可比迭代方法,无需网格排序和分组就可实现算法的并行化,且有较快的收敛速度。该方法编程实现简单,易于采用Open MP实现并行。算例研究表明,相比于LU-SGS格式,在各来流条件下,本文提出的方法收敛速度更快,鲁棒性好,并行和串行结果一致,且内存需求增加很少。 展开更多
关键词 混合网格 隐式算法 并行计算 openmp 雅可比迭代 网格排序
下载PDF
Coupled 2D Hydrodynamic and Sediment Transport Modeling of Megaflood due to Glacier Dam-break in Altai Mountains,Southern Siberia 被引量:6
9
作者 HUANG Wei CAO Zhi-xian +1 位作者 Paul CARLING Gareth PENDER 《Journal of Mountain Science》 SCIE CSCD 2014年第6期1442-1453,共12页
One of the largest known megafloods on earth resulted from a glacier dam-break,which occurred during the Late Quaternary in the Altai Mountains in Southern Siberia.Computational modeling is one of the viable approache... One of the largest known megafloods on earth resulted from a glacier dam-break,which occurred during the Late Quaternary in the Altai Mountains in Southern Siberia.Computational modeling is one of the viable approaches to enhancing the understanding of the flood events.The computational domain of this flood is over 9460 km2 and about 3.784 × 106 cells are involved as a 50 m × 50 m mesh is used,which necessitates a computationally efficient model.Here the Open MP(Open Multiprocessing) technique is adopted to parallelize the code of a coupled 2D hydrodynamic and sediment transport model.It is shown that the computational efficiency is enhanced by over 80% due to the parallelization.The floods over both fixed and mobile beds are well reproduced with specified discharge hydrographs at the dam site.Qualitatively,backwater effects during the flood are resolved at the bifurcation between the Chuja and Katun rivers.Quantitatively,the computed maximum stage and thalweg are physically consistent with the field data of the bars and deposits.The effects of sediment transport and morphological evolution on the flood are considerable.Sensitivity analyses indicate that the impact of the peak discharge is significant,whilst those of the Manningroughness,medium sediment size and shape of the inlet discharge hydrograph are marginal. 展开更多
关键词 Glacier dam-break flood Well-balanced 2D hydrodynamic and sediment transport model open mp parallelization
下载PDF
基于3D-FSM的预紧力端锚数值模拟及其多核并行化研究 被引量:1
10
作者 王翀 刘承论 《岩土力学》 EI CAS CSCD 北大核心 2016年第3期875-882,共8页
在对传统锚杆荷载传递机制分析的基础上,提出了一种考虑托板、锚杆与岩体相互作用的数值模拟方法:通过Kelvin基本解计算出锚杆集中力对围岩的影响,同时就锚杆自由段与相应岩体两端点的位移差相等建立位移方程,结合先前开发的3D-FSM数值... 在对传统锚杆荷载传递机制分析的基础上,提出了一种考虑托板、锚杆与岩体相互作用的数值模拟方法:通过Kelvin基本解计算出锚杆集中力对围岩的影响,同时就锚杆自由段与相应岩体两端点的位移差相等建立位移方程,结合先前开发的3D-FSM数值模拟系统中的表面受力平衡方程进行联立求解,利用所得结果可以计算域内任意点的应力及位移变化,形成完整的预紧力端锚边界元数值模拟系统。通过与Flac^(3D)系统模拟对比,验证了该系统的可靠性。为提高运算效率,对该系统进行基于Open MP的多核并行化改进,给出了改进的基本思路和加速比对比图。由于边界元本身具有建模简单、计算区域大、计算精度高等优点,因此,这种模拟方法有很大的应用价值。 展开更多
关键词 虚拟应力法 锚杆支护 Kelvin基本解 预紧力 openmp
下载PDF
基于EnFCM的海量图像聚类分割算法的并行研究 被引量:3
11
作者 左利云 罗成煜 左右祥 《微型机与应用》 2015年第15期55-58,共4页
图像分割的处理速度成为大规模图像数据处理的瓶颈。本文提出一种基于En FCM的图像聚类分割模型,直接对图像像素的灰度级进行聚类,能显著提高图像聚类分割的处理速度。为进一步提高处理速度,结合En FCM图像聚类分割模型特点,设计了三种... 图像分割的处理速度成为大规模图像数据处理的瓶颈。本文提出一种基于En FCM的图像聚类分割模型,直接对图像像素的灰度级进行聚类,能显著提高图像聚类分割的处理速度。为进一步提高处理速度,结合En FCM图像聚类分割模型特点,设计了三种并行优化策略——纯MPI并行方法、MPI+Open MP混合编程方法和CUDA并行架构方法 ,使其适合于大规模图像处理。实验结果表明,提出的三种并行优化策略都取得良好的加速效果。 展开更多
关键词 图像聚类分割 FCM算法 mpI+open mp CUDA
下载PDF
三维重构算法中球谐函数的并行计算的实现
12
作者 肖晨阳 施游 《电脑知识与技术》 2017年第11X期83-84,共2页
采用基于球坐标系的病毒三维重构算法中球谐函数的计算非常复杂,在单机单核上耗时很长。通过分析,该文实现了一种基于OpenMP的多核并行方法,可以提高球谐函数计算速度,实验结果证明方法简单有效。
关键词 多核系统 并行计算 open mp
下载PDF
高性能嵌入式并行计算架构的研究 被引量:4
13
作者 孟振华 柳柱 +2 位作者 仲雪洁 张宏波 杨诚 《自动化与仪表》 2018年第4期87-90,99,共5页
针对互联网信息时代嵌入式系统难以满足处理大规模、海量数据的需求这一现状,分析当前嵌入式系统架构研究现状,明确了对嵌入式系统快速性、实时性、低功耗、小型化的迫切需求,提出了基于FPGA+DSP的高性能嵌入式并行计算架构。该架构充... 针对互联网信息时代嵌入式系统难以满足处理大规模、海量数据的需求这一现状,分析当前嵌入式系统架构研究现状,明确了对嵌入式系统快速性、实时性、低功耗、小型化的迫切需求,提出了基于FPGA+DSP的高性能嵌入式并行计算架构。该架构充分利用FPGA灵活的时序控制,实现对大容量数据实时的存读取和数据的预处理;在多核DSP内设计改进Open MP并行架构,实现对数据的高速处理。在该并行架构下对算法进行优化、仿真和分析,结果证明架构的可行性和算法的有效性。 展开更多
关键词 嵌入式系统 并行架构 高性能计算 多核DSP FPGA open mp
下载PDF
大规模矩阵相乘的并行算法
14
作者 朱彦辑 国佳佳 《电脑知识与技术》 2017年第6X期59-61,共3页
在大型的科学计算中,矩阵乘法运算是耗时较多的运算,也是工程数值计算中一种常见的运算方式。串行计算程序由于计算时间和计算效率不尽人意,已经不能满足人们的需求,为了降低计算所消耗的时间,人们一直在研究合适的可用于并行的计算矩... 在大型的科学计算中,矩阵乘法运算是耗时较多的运算,也是工程数值计算中一种常见的运算方式。串行计算程序由于计算时间和计算效率不尽人意,已经不能满足人们的需求,为了降低计算所消耗的时间,人们一直在研究合适的可用于并行的计算矩阵相乘的方法,和串行算法相比,矩阵相乘的并行算法要考虑更多方面的问题。该文通过运用API,Open MP多核并行计算,将矩阵按一定规则分块传入每个进程,分别进行矩阵相乘运算,这样可以将计算时间缩短大半。 展开更多
关键词 矩阵相乘 API多核并行 open mp并行
下载PDF
基于HLA的光学设施运控仿真联邦成员设计与优化 被引量:1
15
作者 李承民 张涛 +1 位作者 张斌 张书媛 《电子设计工程》 2016年第1期31-34,共4页
巡天类光学载荷是空间天文观测的重要载荷,运控系统是其中的重要组成。在利用HLA分布式仿真技术对巡天观测仿真过程中发现,空间中复杂的环境以及较多的成像约束使得运控类联邦成员任务负担较重,计算需求大,该联邦成员的运算效率直接影... 巡天类光学载荷是空间天文观测的重要载荷,运控系统是其中的重要组成。在利用HLA分布式仿真技术对巡天观测仿真过程中发现,空间中复杂的环境以及较多的成像约束使得运控类联邦成员任务负担较重,计算需求大,该联邦成员的运算效率直接影响整体仿真效率。因此,本文通过设计乐观约束判别算法以及基于openMP多线程技术优化该成员的运控运算方式,提高运行效率。实验表明,改进后的运控联邦成员大幅提高了光学设施仿真任务执行效率,仿真联邦成员的运算时间减少55%,仿真联邦整体运行时间减少了27.4%。 展开更多
关键词 HLA 光学设施 联邦设计 openmp 乐观策略
下载PDF
一种基于多核集群的海量数据加密存储策略研究
16
作者 武艳娜 赵泽茂 +1 位作者 胡晶芳 梁斌 《信息网络安全》 2015年第8期35-40,共6页
随着互联网和云计算技术的快速发展,云计算中海量用户隐私和数据的安全问题已经越来越引起人们的关注,而加密是保护数据安全的首选方法。为了快速而有效地实现海量数据的安全存储,文章在研究多核处理器集群在海量数据加密存储中的应用... 随着互联网和云计算技术的快速发展,云计算中海量用户隐私和数据的安全问题已经越来越引起人们的关注,而加密是保护数据安全的首选方法。为了快速而有效地实现海量数据的安全存储,文章在研究多核处理器集群在海量数据加密存储中的应用的基础上,提出在多核Linux集群上使用混合Open MP&MPI技术来处理海量数据的解决方案,为多核集群提供在集群节点内部以及节点之间的并行策略,实现海量数据并行处理的层次结构化。同时采用并行虚拟文件系统PVFS2作为多核集群的文件系统,利用其并行I/O的特点实际解决集群系统中海量数据并行存储的问题。文章在多核集群上开发了一个海量数据加密与存储系统摸型。实验结果表明,该系统模型不仅能够有效实现海量数据的存储,还能为海量数据的安全起到一定的保护作用。 展开更多
关键词 多核集群 海量数据 加密存储 open mp mpI PVFS2
下载PDF
短期应用甲基强的松龙对脊柱术后患者血糖的影响
17
作者 白成瑞 王炳强 +3 位作者 李锦军 李东 杨雍 唐海 《颈腰痛杂志》 2011年第1期19-22,共4页
目的观察脊柱手术后短期应用甲强龙(mythylprednisolone)对患者空腹及餐后血糖水平的影响。方法采用病例回顾性分析的方法,对比分析了我院骨科自2006-01-2008-08接受脊柱开放手术并在术后常规较大剂量应用甲强龙治疗的98例患者的术前术... 目的观察脊柱手术后短期应用甲强龙(mythylprednisolone)对患者空腹及餐后血糖水平的影响。方法采用病例回顾性分析的方法,对比分析了我院骨科自2006-01-2008-08接受脊柱开放手术并在术后常规较大剂量应用甲强龙治疗的98例患者的术前术后血糖水平。其中术前证实患有糖尿病40例,无糖尿病患者58例。术前平均空腹血糖水平为(7.06±2.20)mmol/l。术后前3 d甲强龙的日用量为200 mg,术后4~6 d甲强龙的日用量为80 mg,术后7~9 d甲强龙的日用量为40mg。结果总疗程9 d,总剂量达960 mg时,可引起下列变化:(1)应用甲强龙激素(每天200 mg)治疗3 d时患者平均空腹血糖比术前显著升高,其中糖尿病患者空腹血糖增加幅度为38.6%,无糖尿病患者血糖升高幅度为35.8%。应用甲强龙后4~6 d(每天80 mg)和7~9 d(每天40 mg)平均空腹血糖水平也有不同程度的升高,但无显著性差异。停用1周时复查空腹血糖,空腹血糖恢复到术前水平。(2)三餐后2 h血糖升高也有相同规律,即:术后前3 d的三餐后平均血糖较术前有显著性升高,术后4~9 d也有不同程度升高,但无显著性差异,停用MP后1周3餐后2 h血糖恢复到术前水平。(3)血糖升高为一过性,停药后很快恢复到用药前水平,患者未出现酮症酸中毒和明显电解质紊乱现象。结论分别应用甲强龙200 mg、80 mg、40 mg各治疗3 d,可以观察到空腹和餐后血糖均有所升高,其中前3 d升高幅度较大,有显著性差异,中间3 d和最后3 d也有所升高,但无显著性差异。在停药后1周基本可以恢复到术前水平。 展开更多
关键词 甲基强的松龙 脊柱手术 空腹血糖 餐后血糖
下载PDF
面向过程的任务并行化设计方法
18
作者 蒋少丙 刘书刚 《计算机系统应用》 2015年第9期261-264,共4页
为有效实现迭代问题的并行化,提出了面向过程的任务并行化设计方法.该方法的主要思想是对任务求解的单次迭代过程进行并行化设计.将面向过程的思想运用到K-means聚类算法的并行设计过程中,并通过Open MP编程模型来验证该方法的有效性.... 为有效实现迭代问题的并行化,提出了面向过程的任务并行化设计方法.该方法的主要思想是对任务求解的单次迭代过程进行并行化设计.将面向过程的思想运用到K-means聚类算法的并行设计过程中,并通过Open MP编程模型来验证该方法的有效性.通过实验结果分析得知,面向过程的任务并行化执行相较于传统的串行执行在效率上有很大的优势,可以运用到迭代问题的并行化设计过程中. 展开更多
关键词 多核 面向过程 并行化设计 K-MEANS聚类算法 open mp
下载PDF
蒙特卡洛法期权定价的改进 被引量:2
19
作者 朱彦辑 《信息与电脑》 2017年第5期106-108,112,共4页
蒙特卡洛模拟方法是用于期权定价的几大方法之一。蒙特卡洛方法的理论基础是概率论与数理统计,其想法是假设资产价格分布是随机波动,如果知道了这个波动过程,就可以通过随机模拟不同的路径,每做完一次模拟,就产生了一个最终资产价值,再... 蒙特卡洛模拟方法是用于期权定价的几大方法之一。蒙特卡洛方法的理论基础是概率论与数理统计,其想法是假设资产价格分布是随机波动,如果知道了这个波动过程,就可以通过随机模拟不同的路径,每做完一次模拟,就产生了一个最终资产价值,再进行若干次这样的过程,那么所得到的结果就是一个最终的资产价值分布,从这个分布中可以得到期望的资产价格。蒙特卡洛方法的最大优势是误差收敛率不依赖于问题的维数,但若在获得精确定价结果的要求下,蒙特卡洛法需要进行上百万次的模拟,计算量巨大,为改进蒙特卡洛模拟,笔者考虑采用并行模拟的方法,能有效提高计算效率。 展开更多
关键词 蒙特卡洛模拟 BLACK-SCHOLES方程 并行计算 open mp mpI
下载PDF
异构计算模型下基于聚类的车型识别
20
作者 房建宏 张亚力 焦晓帆 《青海交通科技》 2018年第1期16-25,共10页
根据线圈检测器采集到的信号变化的波形不同,可以利用k均值聚类以及Bayesian分类器进行车型识别。训练过程中,使用k均值聚类算法对不同波形的特征值归类,再采用Bayesian分类算法去获取分类器。当待处理的数据集较大时,受限于CPU的计算能... 根据线圈检测器采集到的信号变化的波形不同,可以利用k均值聚类以及Bayesian分类器进行车型识别。训练过程中,使用k均值聚类算法对不同波形的特征值归类,再采用Bayesian分类算法去获取分类器。当待处理的数据集较大时,受限于CPU的计算能力,k均值聚类在特征值归类时会表现出较大的延迟,对识别效率造成影响。本文专为CPU-GPU异构计算环境设计的k均值聚类算法及其实现,通过分块计算相似性矩阵,打破了GPU设备内存的限制,所能处理的数据集规模仅受限于CPU主存的容量。本文中使用CUDA设计实现双缓冲轮转四段流水机制,通过重叠计算与传输在打破存储瓶颈的同时保证了高计算性能。在配有一块GTX 480 GPU的单结点上能够对百万以上规模的数据集进行聚类,并对实验中的四个数据集取得了相对于使用16进程的MPI并行聚类实现2.0~4.5倍的性能。 展开更多
关键词 车型识别 K均值聚类 CPU-GPU异构计算 计算统一设备架构 CUDA
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部