期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
一种基于ModelSim的红外图像仿真方法与系统
1
作者 李江辉 《红外技术》 CSCD 北大核心 2024年第7期802-806,共5页
在红外热成像的图像处理算法过程中,传统的算法仿真需要借助Matlab等图形处理工具软件先进行仿真再转化成FPGA处理器中可以运行的算法代码,而Matlab上的运行的语言、实现方式与FPGA硬件上运行的硬件描述语言和实现方式完全不同。导致转... 在红外热成像的图像处理算法过程中,传统的算法仿真需要借助Matlab等图形处理工具软件先进行仿真再转化成FPGA处理器中可以运行的算法代码,而Matlab上的运行的语言、实现方式与FPGA硬件上运行的硬件描述语言和实现方式完全不同。导致转化过程复杂、转化精度损失、开发周期长等。本文提出了一种基于ModelSim仿真工具的红外图像仿真方法与系统,与Matlab等图形处理工具一样,编程写好代码,导入图像仿真后,立即输出图像显示,并能查看中间处理过程中的数据变化情况。并且ModelSim仿真运行的仿真代码可以直接拿到FPGA编译工具中运行,最终部署在硬件板卡上。在工程应用中,转化过程简单,开发效率大大提升。 展开更多
关键词 FPGA MODELSIM 红外热成像 仿真方法 图像处理算法 硬件描述语言 硬件加速
下载PDF
The Model of Asynchronous Parallel Nonlinear Multisplitting Method on Shared Memory System
2
作者 Yang Cao Qingyang Li(Dept. of Applied Mathematics, Tsinghua Universitg Beijing 100084, P.R. of China) 《Wuhan University Journal of Natural Sciences》 CAS 1996年第Z1期483-489,共7页
Nonlinear multisplitting method is known as parallel iterative methods for solving a large-scale system of nonlinear equations F(x) = 0. We extend the idea of nonlinear multisplitting and consider a new model ill whic... Nonlinear multisplitting method is known as parallel iterative methods for solving a large-scale system of nonlinear equations F(x) = 0. We extend the idea of nonlinear multisplitting and consider a new model ill which the iteration is executed asynchronously: Each processor calculate the solution of an individual nonlinear system belong to its nonlinear multisplitting and can update the global approximation residing in the shared memory at any time. A local convergence analysis of this model is presented. Finally, we give a uumerical example which shows a 'strange' property that speedup Sp > p and efficiency Ep > 1. 展开更多
关键词 Asynchronous Parallel Nonlinear Multisplitting method Shared Memory processors Efficiency. speedup.
下载PDF
基于OpenMP的三维显式物质点法并行化研究 被引量:14
3
作者 黄鹏 张雄 +1 位作者 马上 王汉奎 《计算力学学报》 EI CAS CSCD 北大核心 2010年第1期21-27,共7页
基于OpenMP技术开发了三维显式物质点并行程序MPM3DMP。为了避免节点更新阶段的数据竞争,采用区域分解法将背景网格分解为均匀的子域,每个线程负责一个子域的节点变量更新,然后将更新后的节点变量装配到整体。在质点更新阶段采用了循环... 基于OpenMP技术开发了三维显式物质点并行程序MPM3DMP。为了避免节点更新阶段的数据竞争,采用区域分解法将背景网格分解为均匀的子域,每个线程负责一个子域的节点变量更新,然后将更新后的节点变量装配到整体。在质点更新阶段采用了循环分解方法进行并行。针对Taylor杆碰撞的三种计算模型,在双Intel Woodcrest 4核CPU服务器下进行了测试:粗模型在4核下加速比为3.82,在8核下为6.23,中模型在4核下加速比为3.79,在8核下加速比为6.23;细模型在4核下加速比为3.75,8核下加速比为6.26。因此,本文的并行程序具有较好的并行效率和可扩展性。 展开更多
关键词 OPENMP 显式物质点法 区域分解法 循环分解方法 加速比
下载PDF
三维多群六角形几何中子扩散程序开发 被引量:1
4
作者 孙伟 倪东洋 +1 位作者 李庆 王侃 《原子能科学技术》 EI CAS CSCD 北大核心 2013年第10期1707-1712,共6页
本文基于解析基函数展开方法求解中子扩散方程的原理,利用满足中子扩散方程的解析基函数,将节块内的各群中子注量率近似展开。为提高该方法的计算精度,节块间耦合条件采用面中子注量率和面中子净流连续。节块间耦合条件的选取需利用源... 本文基于解析基函数展开方法求解中子扩散方程的原理,利用满足中子扩散方程的解析基函数,将节块内的各群中子注量率近似展开。为提高该方法的计算精度,节块间耦合条件采用面中子注量率和面中子净流连续。节块间耦合条件的选取需利用源迭代法来求解中子扩散方程。源迭代中的内迭代选用加速的高斯-塞德尔方法,外迭代采用Lyusternik-Wagner外推加速收敛技术。针对中子注量率收敛慢、有效增殖因数收敛快、内迭代方程组系数矩阵更新耗时的特点,采用一种新的加速方法——一次外迭代多次内迭代的方法。基于以上理论模型,发展了三维多群六角形几何中子扩散程序HANDF-D,对三维二群vver440基准题、高通量堆临界实验2、三维四群热堆问题、三维七群快堆问题计算的结果表明,该方法能准确快速地给出堆芯有效增殖因数和功率。 展开更多
关键词 解析基函数 中子扩散方程 高斯-塞德尔方法 加速收敛方法
下载PDF
基于MapReduce的最小二乘支持向量机回归模型 被引量:4
5
作者 代亮 许宏科 +2 位作者 陈婷 钱超 梁殿鹏 《计算机应用研究》 CSCD 北大核心 2015年第4期1060-1064,共5页
针对最小二乘支持向量机处理大规模数据集耗时长且受内存限制的特点,将局部多模型方法与MapReduce编程模式相结合,提出一种并行最小二乘支持向量机回归模型。模型由两组MapReduce过程组成,首先按照输入样本集对样本数据进行聚类操作,再... 针对最小二乘支持向量机处理大规模数据集耗时长且受内存限制的特点,将局部多模型方法与MapReduce编程模式相结合,提出一种并行最小二乘支持向量机回归模型。模型由两组MapReduce过程组成,首先按照输入样本集对样本数据进行聚类操作,再对聚类后得到的子类按输出样本集进行二次聚类操作,分别得到局部模型数目和各局部模型综合加权输出计算结果。实验结果表明,并行最小二乘支持向量机回归模型具有较好的加速比和可扩展性。 展开更多
关键词 最小二乘支持向量机 MapReduce编程模式 局部多模型方法 加速比 可扩展性
下载PDF
转子振动故障信号的盲分离 被引量:30
6
作者 李舜酩 《航空动力学报》 EI CAS CSCD 北大核心 2005年第5期751-756,共6页
介绍了盲源信号分离基本原理。基于最小化互信息原理,建立了用独立分量分析方法估计分离矩阵的加速梯度法,并给出了实现步骤。利用所建立的方法进行振动信号盲源分离的数值仿真,分离后的信号波形与源信号一致。对具有故障的实际转子进... 介绍了盲源信号分离基本原理。基于最小化互信息原理,建立了用独立分量分析方法估计分离矩阵的加速梯度法,并给出了实现步骤。利用所建立的方法进行振动信号盲源分离的数值仿真,分离后的信号波形与源信号一致。对具有故障的实际转子进行多传感器信号采集并进行盲分离,不同故障的特征被分离开来。分析实例体现了所建立的方法在盲源信号分离中的有效性和对转子故障分离的实用性。 展开更多
关键词 航空、航天推进系统 转子 振动 盲源分离 独立分量分析 加速梯度法
下载PDF
基于PVM的网络并行子结构共轭梯度法 被引量:5
7
作者 余天堂 姜弘道 《工程力学》 EI CSCD 北大核心 2001年第5期29-35,共7页
网络并行环境是近年来国际上并行环境的一个重要方向,PVM是当前最流行的支持异构或同构型网络并行计算的软件平台之一。本文采用子结构共轭梯度法研究了基于PVM的网络并行有限元,该方法将有限元网格划分为n个子结构,再将n个... 网络并行环境是近年来国际上并行环境的一个重要方向,PVM是当前最流行的支持异构或同构型网络并行计算的软件平台之一。本文采用子结构共轭梯度法研究了基于PVM的网络并行有限元,该方法将有限元网格划分为n个子结构,再将n个子结构的数据分送给网上n台可用微机,n台微机并行形成和组集n个子结构的劲度矩阵和荷载列阵,然后采用预条件共轭梯度法并行求解结点位移,最后n台微机并行对n个子结构进行应变和应力分析。该方法不需形成结构的总体劲度矩阵和荷载列阵,可同时迭代求出所有结点位移,且比一般的迭代法收敛要快。算例表明此种并行子结构共轭梯度法在网络上能获得较高的并行加速比。 展开更多
关键词 网络并行环境 PVM 子结构法 预条件共轭梯度法 并行加速比 有限元
下载PDF
交通基础设施质量提升对城市人口规模的影响——基于铁路提速的实证分析 被引量:20
8
作者 宋晓丽 李坤望 《当代经济科学》 CSSCI 北大核心 2015年第3期19-26,124-125,共8页
自1997年以来我国实施了6次铁路提速,本文将其视为交通基础设施质量提高的一次自然实验,选取7条铁路干线作为铁路提速的代表,使用倍差法考察了其对沿途站点城市人口规模的影响。研究发现,在整个提速期间,相对于未提速城市,铁路提速促使... 自1997年以来我国实施了6次铁路提速,本文将其视为交通基础设施质量提高的一次自然实验,选取7条铁路干线作为铁路提速的代表,使用倍差法考察了其对沿途站点城市人口规模的影响。研究发现,在整个提速期间,相对于未提速城市,铁路提速促使沿途站点城市人口规模增加了35.2%。进一步的分析显示,铁路提速对提速城市人口规模增长的促进作用仅在长期显著;铁路提速对城市人口规模的影响存在明显的地域差异。 展开更多
关键词 铁路提速 城市人口规模 倍差法
下载PDF
耦合GPU与PCG的EFG法并行计算及应用研究 被引量:3
9
作者 龚曙光 廖宇犁 +2 位作者 刘奇良 张建平 卢海山 《应用力学学报》 CAS CSCD 北大核心 2017年第1期100-106,共7页
针对迭代法求解无网格Galerkin法中线性方程组收敛速度慢的问题,提出了一种耦合GPU和预处理共轭梯度法的无网格Galerkin法并行算法,在对其总体刚度矩阵、总体惩罚刚度矩阵进行并行联合组装的同时即可得到对角预处理共轭矩阵,有效地节省... 针对迭代法求解无网格Galerkin法中线性方程组收敛速度慢的问题,提出了一种耦合GPU和预处理共轭梯度法的无网格Galerkin法并行算法,在对其总体刚度矩阵、总体惩罚刚度矩阵进行并行联合组装的同时即可得到对角预处理共轭矩阵,有效地节省了GPU的存储空间和计算时间;通过采用四面体积分背景网格,提高了所提算法对三维复杂几何形状问题的适应性。通过2个三维算例验证了所提算法的可行性,且预处理共轭梯度法与共轭梯度法相比,其迭代次数最大可减少1686倍,最大的迭代时间可节省1003倍;同时探讨了加速比与线程数和节点个数之间的关系,当线程数为64时其加速比可达到最大,且预处理共轭梯度法的加速比与共轭梯度法相比可增大4.5倍,预处理共轭梯度法的加速比最大达到了88.5倍。 展开更多
关键词 无网格GALERKIN法 预处理共轭梯度法 GPU 加速比 四面体积分网格
下载PDF
Level set函数重新初始化的并行快速步进法 被引量:4
10
作者 黄筱云 董国海 +1 位作者 赵利平 程永舟 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2016年第5期666-671,689,共7页
为提高level set函数重新初始化的计算效率,基于分区并行思想,提出一种快速步进法的并行策略,实现level set函数的快速并行重新初始化。通过对圆球、五叶管和圆环管等算例的level set函数重新初始化,讨论了新并行算法的准确性和效率。... 为提高level set函数重新初始化的计算效率,基于分区并行思想,提出一种快速步进法的并行策略,实现level set函数的快速并行重新初始化。通过对圆球、五叶管和圆环管等算例的level set函数重新初始化,讨论了新并行算法的准确性和效率。结果表明,与串行快速步进法相比,并行算法保留了串行算法的精度,仍基本保持在1阶左右,同时显著减少了重新初始化的计算时间,特别在8线程条件下,所获的最佳加速比能够达到5。 展开更多
关键词 LEVEL set函数 重新初始化 快速步进法 并行 分区 并行算法 加速比
下载PDF
多波前并行处理的弹塑性子结构并行有限元 被引量:8
11
作者 余天堂 姜弘道 《计算力学学报》 CAS CSCD 1999年第4期493-496,共4页
研究一种基于PVM 的弹塑性子结构并行有限元法。利用多个波前,对各子结构并行地进行静凝聚。再采用预条件共轭梯度法(PCG)并行求解界面方程。算例表明该方法能获得较好的并行加速比,同时也能有效地节省内存量。
关键词 PVM 弹塑性 子结构 并行有限元 多波前
下载PDF
FMM算法的并行化方法 被引量:2
12
作者 赖国明 杨圣云 袁德辉 《计算机应用与软件》 CSCD 北大核心 2007年第7期176-178,共3页
详细分析快速多极算法FMM(Fast Multipole Method)的基本原理,并对引力场的势函数的多极展开和泰勒局部展开进行了详细的推导。给出了串行FMM算法的伪码描述,并对其进行并行化分析、处理,对FMM算法进行了并行化研究。最后,在基于MPI的... 详细分析快速多极算法FMM(Fast Multipole Method)的基本原理,并对引力场的势函数的多极展开和泰勒局部展开进行了详细的推导。给出了串行FMM算法的伪码描述,并对其进行并行化分析、处理,对FMM算法进行了并行化研究。最后,在基于MPI的群集并行计算环境下进行大量的实验并采集实验数据,对算法进行并行化性能分析,得到较好的并行加速比和较高的并行效率。 展开更多
关键词 快速多极算法FMM 多极扩展 泰勒扩展 并行算法 加速比
下载PDF
基于核方法的并行模糊聚类算法 被引量:8
13
作者 彭秋生 魏文红 《计算机工程与设计》 CSCD 北大核心 2008年第8期1881-1883,共3页
介绍并分析了模糊C-均值聚类算法、基于核方法的模糊C-均值聚类算法以及硬聚类算法。将硬聚类算法和模糊聚类算法结合起来,利用硬聚类算法初始化聚类中心,有效的减少模糊聚类算法的迭代次数。针对海量数据处理问题,将改进后的算法并行化... 介绍并分析了模糊C-均值聚类算法、基于核方法的模糊C-均值聚类算法以及硬聚类算法。将硬聚类算法和模糊聚类算法结合起来,利用硬聚类算法初始化聚类中心,有效的减少模糊聚类算法的迭代次数。针对海量数据处理问题,将改进后的算法并行化,有效地提高了数据处理速度和效率,并在分布式互联PC环境下进行了性能测试。测试结果表明,基于核方法的并行模糊聚类算法具有很好的规模增长性和加速比。 展开更多
关键词 并行 模糊聚类 核方法 分布式 加速比
下载PDF
多网格叠缩并行计算
14
作者 徐正权 石冰心 陈锦江 《华中理工大学学报》 CSCD 北大核心 1994年第1期31-35,共5页
提出一种非递归多网格算法。它适合于允许递归和不允许递归两种场合,在分布式存储计算机上的叠缩并行实现结果表明:其顺序/并行加速显著,并行化效率有大幅度提高。
关键词 非递归表示 叠缩并行化 多网格法
下载PDF
步进电动机最佳变速控制的单片机实现 被引量:5
15
作者 徐进 孙兴进 《上海电力学院学报》 CAS 2000年第1期13-17,共5页
针对现有的步进电动机速度控制规律不易实现、灵活性较差等问题,提出了用定时方法实现指数型最佳升降频的控制.试验证实了所提方法的正确性和可行性.
关键词 步进电动机 定量方法 最佳变速控制 单片机
下载PDF
样条插值算法在汽车门曲线设计中的应用 被引量:2
16
作者 王福鑫 刘石强 廖芳芳 《湘南学院学报》 2014年第2期111-114,共4页
在汽车门曲线设计中,运用三次样条插值法构造了严格对角占优的三弯矩方程组,利用追赶法求解方程组,并用Matlab进行了数值实验得到了数值解,汇出了曲线图,进而,我们将三次样条插值算法与分段线性插值、分段抛物插值、邻近点插值的结果进... 在汽车门曲线设计中,运用三次样条插值法构造了严格对角占优的三弯矩方程组,利用追赶法求解方程组,并用Matlab进行了数值实验得到了数值解,汇出了曲线图,进而,我们将三次样条插值算法与分段线性插值、分段抛物插值、邻近点插值的结果进行比较,实验结果表明,三次样条插值算法能获得高精度的插值结果. 展开更多
关键词 三次样条插值 三弯矩方程组 追赶法 数值解
下载PDF
层流扩散燃烧在GPU上的并行计算和数值分析
17
作者 魏浩洋 曾国荪 丁春玲 《计算机应用》 CSCD 北大核心 2013年第9期2428-2431,2435,共5页
在实际工程应用中,使用传统的CPU串行计算来开展燃烧数值模拟往往难以满足对模拟速度的要求。利用GPU比CPU更强的计算能力,通过在交错网格上将燃烧物理方程离散化,使用预处理稳定双共轭梯度法(PBiCGSTAB)求解离散化方程,并且探索面向GP... 在实际工程应用中,使用传统的CPU串行计算来开展燃烧数值模拟往往难以满足对模拟速度的要求。利用GPU比CPU更强的计算能力,通过在交错网格上将燃烧物理方程离散化,使用预处理稳定双共轭梯度法(PBiCGSTAB)求解离散化方程,并且探索面向GPU编程的矩阵向量乘并行算法和逆矩阵向量乘并行算法,从而给出一种在GPU上数值求解层流扩散燃烧的可行方法。实验结果表明,GPU并行程序获得了相对串行CPU程序约10倍以上的加速效果,且计算结果与实际情况相符,因而所提方法是可行且高效的。 展开更多
关键词 层流扩散燃烧 数值模拟 GPU并行计算 预处理稳定双共轭梯度法 加速比
下载PDF
多种任务调度混合的IB-LBM并行优化方法 被引量:1
18
作者 刘智翔 刘慧超 +2 位作者 黄冬梅 周丽萍 苏诚 《计算机应用》 CSCD 北大核心 2020年第2期386-391,共6页
在使用浸入边界-格子玻尔兹曼方法(IB-LBM)求解流场时,为了得出比较精确的结果,往往需要规模较大、较密集的流场网格,这就会造成模拟过程时间长的问题。为了提高模拟的效率,利用IB-LBM局部计算的特点,结合OpenMP中三种不同的任务调度方... 在使用浸入边界-格子玻尔兹曼方法(IB-LBM)求解流场时,为了得出比较精确的结果,往往需要规模较大、较密集的流场网格,这就会造成模拟过程时间长的问题。为了提高模拟的效率,利用IB-LBM局部计算的特点,结合OpenMP中三种不同的任务调度方式,给出了IB-LBM的并行优化方法。在并行优化中混合使用三种任务调度方式,以弥补单一任务调度造成的负载不均衡问题;将IB-LBM进行结构化分解,测试每一结构部分的最优调度方式,根据实验结果选择最优的调度组合方式,而在不同线程数下,最优的组合方式是不同的。优化结果通过并行加速比来检验,可以得出:在线程数较少的情况下,加速比趋近于理想状态;在线程数较多的情况下,虽然线程开辟和销毁的额外时间消耗对性能的优化产生了影响,模型的并行性能仍有了很大的提升。流场的模拟结果显示,在进行并行优化后,IB-LBM对流固耦合问题模拟的准确性并没有受到影响。 展开更多
关键词 浸入边界法 格子玻尔兹曼法 流场 OPENMP 任务调度 并行 加速比
下载PDF
金属球电磁散射特性FDTD混合并行算法研究 被引量:1
19
作者 王彦良 《电子测量技术》 2016年第11期75-79,共5页
研究金属球电磁散射特性与MPI-OpenMP混合并行FDTD算法,可为金属目标和其他复杂介质目标的电磁散射特性及大数据计算提供一定的理论依据和方法借鉴。采用FDTD方法分析了自由空间中金属球的电磁特性,利用Fortran软件实现了金属球数据建模... 研究金属球电磁散射特性与MPI-OpenMP混合并行FDTD算法,可为金属目标和其他复杂介质目标的电磁散射特性及大数据计算提供一定的理论依据和方法借鉴。采用FDTD方法分析了自由空间中金属球的电磁特性,利用Fortran软件实现了金属球数据建模,得到了远场区电场分量和雷达散射截面的波形曲线,实现了MPI-OpenMP混合并行FDTD计算。实验表明,计算结果与现有实验数据非常吻合,且该并行方法是正确的,具有良好的加速比和效率。 展开更多
关键词 金属球 时域有限差分方法 高性能计算 加速比 效率
下载PDF
拉氏反变换的数值并行算法及其在弹性动力学边界元法中的应用 被引量:1
20
作者 王志灵 程玉民 《力学季刊》 CSCD 北大核心 2005年第2期224-230,共7页
本文讨论了快速拉氏反变换的数值并行算法,并将其应用于瞬态弹性动力学的边界元法。为了本文提出的并行算法的优越性,还给出了串行算法,最后将串行和并行计算结果与解析解进行了比较,说明本文方法的正确性和有效性。对拉氏反变换的数值... 本文讨论了快速拉氏反变换的数值并行算法,并将其应用于瞬态弹性动力学的边界元法。为了本文提出的并行算法的优越性,还给出了串行算法,最后将串行和并行计算结果与解析解进行了比较,说明本文方法的正确性和有效性。对拉氏反变换的数值并行算法及其应用于瞬态弹性动力学边界元法的优越性进行了研究。从计算时间可以看出,并行计算的时间比串行计算时间可大幅度减少,说明了本文方法的优越性。 展开更多
关键词 拉氏变换 弹性动力学 边界元法 并行算法 并行效率 复杂度 加速比
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部