期刊文献+
共找到362篇文章
< 1 2 19 >
每页显示 20 50 100
基于NEON的VSIPL加速技术研究
1
作者 闫妍 周磊 +1 位作者 梁益华 杨振虎 《航空计算技术》 2024年第2期97-100,105,共5页
针对航空及通信领域嵌入式信息处理软件的可移植性和实时性需求,提出了ARM平台下基于NEON的矢量信号图像处理函数库(VSIPL)中间件算法加速优化的方法。VSIPL中间件能够解决信号处理软件在不同平台的复用性问题,通过对VSIPL的数据特性进... 针对航空及通信领域嵌入式信息处理软件的可移植性和实时性需求,提出了ARM平台下基于NEON的矢量信号图像处理函数库(VSIPL)中间件算法加速优化的方法。VSIPL中间件能够解决信号处理软件在不同平台的复用性问题,通过对VSIPL的数据特性进行分析,然后将NEON技术应用于VSIPL加速设计中,实现数据的并行处理以提高运算速率。最后,对VSIPL中的典型向量算法优化前后进行性能对比测试,并分析了不同因素对加速效果的影响,测试结果验证了加速方法的可行性。提出的基于NEON的VSIPL加速设计方法能有效提高信号处理软件的性能,具有一定的指导意义和工程应用价值。 展开更多
关键词 嵌入式信号处理 矢量信号图像处理函数库 加速设计 VSIPL NEON
下载PDF
基于多尺度边缘特征的深度学习电阻率反演方法
2
作者 刘征宇 庞永昊 +4 位作者 张凤凯 万勇 刘磊 蔡玉梅 刘嘉雯 《岩土力学》 EI CAS CSCD 北大核心 2023年第11期3299-3306,共8页
直流电阻率法是一种经济、高效的工程地球物理探测手段,对含水构造敏感。线性电阻率反演是实际探测中的主流方法,但其反演结果容易陷入局部最优,产生错误的地质解译。与之相比,无监督反演方法能够采用物理规律和数据挖掘双驱动训练网络... 直流电阻率法是一种经济、高效的工程地球物理探测手段,对含水构造敏感。线性电阻率反演是实际探测中的主流方法,但其反演结果容易陷入局部最优,产生错误的地质解译。与之相比,无监督反演方法能够采用物理规律和数据挖掘双驱动训练网络,摆脱对真实模型的依赖,具备在实际数据中全局搜索的可行性。在无监督反演方法的基础上,创新了基于多尺度边缘特征的深度学习边界刻画方法。针对反演成像边界模糊的问题,借鉴地震、电磁勘探中多尺度反演的经验,提出了一种电阻率多尺度反演方法,以多尺度反演目标函数作为损失函数修正网络梯度,有效提高了无监督学习反演的边界刻画能力。在上海市域铁路机场联络线1号风井工程开展现场试验,以5号基坑地连墙渗漏点探测为例,探明了15处低阻异常,指导基坑补强作业,验证了方法的可行性和有效性。 展开更多
关键词 直流电阻率反演 无监督深度学习 多尺度反演 工程验证
下载PDF
两种新的Toeplitz矩阵填充加速临近梯度算法
3
作者 王川龙 牛建华 申倩影 《运筹学学报》 CSCD 北大核心 2023年第3期96-108,共13页
本文提出了两种改进的Toeplitz矩阵填充加速临近梯度算法,使迭代矩阵每一步都保持Toeplitz结构,从而降低了奇异值分解时间。在理论上,证明了新算法在一些合理条件下的收敛性。同时,数值实验表明,在Toeplitz矩阵填充问题中,新算法比加速... 本文提出了两种改进的Toeplitz矩阵填充加速临近梯度算法,使迭代矩阵每一步都保持Toeplitz结构,从而降低了奇异值分解时间。在理论上,证明了新算法在一些合理条件下的收敛性。同时,数值实验表明,在Toeplitz矩阵填充问题中,新算法比加速临近梯度(APG)算法在时间上有明显减少。 展开更多
关键词 矩阵填充 TOEPLITZ矩阵 加速临近梯度算法
下载PDF
基于改进FPM法高维复杂多相分离过程的GPU并行计算研究 被引量:1
4
作者 甄玉洁 胥康 +1 位作者 蒋涛 任金莲 《应用数学和力学》 CSCD 北大核心 2023年第1期93-104,共12页
为了高效、准确地模拟高维多元Cahn-Hilliard(C-H)方程描述的复杂相分离过程,该文发展了一种基于纯无网格改进有限点集法(corrected finite pointset method,CFPM)和CPU-GPU异构的快速并行算法(简称为CFPMGPU).CFPM-GPU的构造过程为:①... 为了高效、准确地模拟高维多元Cahn-Hilliard(C-H)方程描述的复杂相分离过程,该文发展了一种基于纯无网格改进有限点集法(corrected finite pointset method,CFPM)和CPU-GPU异构的快速并行算法(简称为CFPMGPU).CFPM-GPU的构造过程为:①基于Taylor展开和加权最小二乘思想,采用Wendland权函数推导出空间一/二阶导数的有限点集法(finite pointset method,FPM)格式;②将多元C-H方程中四阶导数分为两个二阶导数,依次运用FPM对其离散得到C-H的改进FPM法(CFPM);③基于CUDA的单个GPU架构,首次给出了CFPM的一种并行算法以提高计算效率.数值研究中,首先对二维径向或三维球对称C-H方程描述的相分离基准算例进行了求解,并与可靠结果作对比验证了提出的并行算法的准确性和高效性,单个CPU-GPU异构并行计算效率约是串行情况的160倍;其次,运用CFPM-GPU对复杂区域上二维/三维的两相或三相分离现象进行数值预测,并与其他方法结果做比较.数值结果表明,给出的CFPM-GPU能准确、高效地模拟二维/三维复杂区域上的多相分离过程. 展开更多
关键词 FPM格式 三维多相分离 多元Cahn-Hilliard GPU并行
下载PDF
单层缓冲区多层网格的格子Boltzmann方法
5
作者 杨子韬 王良军 +2 位作者 朱文浩 丁虎 张武 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第3期473-490,共18页
针对多层网格格子Boltzmann方法(lattice Boltzmann method,LBM),发展了一种无需时间插值的、基于单层缓冲区的粗细网格信息传递优化算法.该算法利用四叉树结构,构建不同层级格点之间的父子关系,简化了粗细网格交界面上的分布函数转换,... 针对多层网格格子Boltzmann方法(lattice Boltzmann method,LBM),发展了一种无需时间插值的、基于单层缓冲区的粗细网格信息传递优化算法.该算法利用四叉树结构,构建不同层级格点之间的父子关系,简化了粗细网格交界面上的分布函数转换,可以充分发挥LBM的局部性与并行性.基于该算法开发了一套通用的多层网格LBM并行程序,对顶盖驱动方腔流、点声源扩散、NACA0012翼型绕流问题进行了数值计算,计算结果验证了该算法和程序的有效性及其良好的加速比、效率和可扩展性等并行性能.与标准LBM相比,本文基于单层缓冲区的多层网格LBM在计算稳定性、收敛速度和计算效率等方面具有明显优势. 展开更多
关键词 格子BOLTZMANN方法 单层缓冲区 多层网格 并行计算 性能评估
下载PDF
研究生课程“并行算法”教学内容优化设计研究
6
作者 吴建平 银福康 +2 位作者 杨锦辉 彭军 汪祥 《教育教学论坛》 2023年第8期75-78,共4页
研究生课程“并行算法”是在大规模科学与工程计算需求越来越大的情况下开设的,旨在让学生学会如何实现并行计算的方法,熟练掌握并行计算的实现过程。基于课程教学经验和实践,论述了侧重并行计算思维训练和理论实践相结合的教学理念,以... 研究生课程“并行算法”是在大规模科学与工程计算需求越来越大的情况下开设的,旨在让学生学会如何实现并行计算的方法,熟练掌握并行计算的实现过程。基于课程教学经验和实践,论述了侧重并行计算思维训练和理论实践相结合的教学理念,以及基于该理念与模块化方式,从基本概念、基本技术、具体算法到编程实践等层面对教学内容的优化设计,以提升学生的学习效果与综合素质。 展开更多
关键词 教学内容 模块化 并行算法 思维训练 综合素质
下载PDF
基于快速拉格朗日分析–并行粒子群算法的黏弹塑性参数反演及其应用 被引量:8
7
作者 陈炳瑞 冯夏庭 +2 位作者 黄书岭 杨成祥 张传庆 《岩石力学与工程学报》 EI CAS CSCD 北大核心 2007年第12期2517-2525,共9页
将改进粒子群算法和大型岩土数值计算软件FLAC3D有机结合,提出基于快速拉格朗日分析的全局并行改进粒子群参数反演方法。该方法既没有采用EBE方法也没有利用区域分解技术对计算区域进行处理,而是对用于参数反演的优化方法进行全局并行,... 将改进粒子群算法和大型岩土数值计算软件FLAC3D有机结合,提出基于快速拉格朗日分析的全局并行改进粒子群参数反演方法。该方法既没有采用EBE方法也没有利用区域分解技术对计算区域进行处理,而是对用于参数反演的优化方法进行全局并行,这既避免了区域分解难于确定子区域边界的问题,又避免了EBE方法的大量数据交换,无疑将大大提高并行效率。基于锦屏二级水电站辅助洞BK14+599断面的算法性能分析证实了这一特性。锦屏二级水电站辅助洞黏弹塑性参数反演表明该方法对大规模岩土工程参数反演提供了一种行之有效的方法,获得了可靠的长期稳定性分析参数。利用获得的参数进行正向数值分析,计算结果表明:变形主要发生在顶拱和两侧墙靠上部位;洞周出现了一定范围的塑性区,以两侧为最,洞底次之,内壁出现了拉伸屈服;洞肩和墙角出现了应力集中现象,洞底出现底鼓现象,这些现象与现场观测到的结果一致。因此,引水隧洞在设计、施工时应加以注意,防止造成不必要的损失。 展开更多
关键词 数值分析 黏弹塑性 反分析 粒子群 并行算法 快速拉格朗日分析 锦屏二级水电站
下载PDF
三维面向对象的并行粒子模拟程序PLASIM3D 被引量:11
8
作者 马燕云 常文蔚 +2 位作者 银燕 卓红斌 徐涵 《计算物理》 EI CSCD 北大核心 2004年第3期305-311,共7页
 设计了基于区域分解的三维粒子模拟的并行算法,基于消息传递环境(MPI)编制了三维面向对象的并行粒子模拟程序PLASIM3D(PlasmaSimulator分别取前3个字母,3D表示三维).对激光与低密度等离子体薄靶相互作用问题作了粒子模拟计算,验证了...  设计了基于区域分解的三维粒子模拟的并行算法,基于消息传递环境(MPI)编制了三维面向对象的并行粒子模拟程序PLASIM3D(PlasmaSimulator分别取前3个字母,3D表示三维).对激光与低密度等离子体薄靶相互作用问题作了粒子模拟计算,验证了该并行程序.最后在高性能并行机上测试并分析了并行性能,获得了接近线性的加速比. 展开更多
关键词 激光等离子体相互作用 粒子模拟 并行运算 麦克斯韦方程
下载PDF
Delaunay四面体网格并行生成算法研究进展 被引量:17
9
作者 王磊 聂玉峰 李义强 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2011年第6期923-932,共10页
纵观近20年国内外Delaunay四面体网格并行生成算法的发展,依据其并行框架分为区域分解模式和基于节点模式,其中区域分解模式根据通信复杂程度进一步分为耦合的和非耦合的;对典型算法中网格质量传承性、串行代码嵌入率、扩展性、负载平... 纵观近20年国内外Delaunay四面体网格并行生成算法的发展,依据其并行框架分为区域分解模式和基于节点模式,其中区域分解模式根据通信复杂程度进一步分为耦合的和非耦合的;对典型算法中网格质量传承性、串行代码嵌入率、扩展性、负载平衡和容错性等性能进行分析,结合数值测试结果总结了各类模式算法的优缺点.最后,针对各类模式算法的特点探讨了Delaunay四面体网格并行生成技术的发展趋势. 展开更多
关键词 并行算法 Delaunay四面体网格 区域分解模式 基于节点模式
下载PDF
无单元伽辽金法的并行计算 被引量:8
10
作者 曾亿山 卢德唐 曾清红 《计算力学学报》 EI CAS CSCD 北大核心 2008年第3期385-391,共7页
对无单元伽辽金法的并行计算进行了详细研究,并将其应用于弹性动力学问题。使用并行桶搜索算法进行节点搜索,使用并行几何搜索算法进行样点搜索,讨论了移动最小二乘MLS(Moving Least Squares)形函数及其导数的并行计算和方程组的并行求... 对无单元伽辽金法的并行计算进行了详细研究,并将其应用于弹性动力学问题。使用并行桶搜索算法进行节点搜索,使用并行几何搜索算法进行样点搜索,讨论了移动最小二乘MLS(Moving Least Squares)形函数及其导数的并行计算和方程组的并行求解,并利用多层图形划分实现负载平衡。最后给出了并行无单元伽辽金法应用于弹性动力学的计算流程和实例。计算结果表明无单元伽辽金法具有很高的并行性和很好的并行效率,对其进行并行计算具有非常重要的意义。 展开更多
关键词 无单元伽辽金方法 无网格方法 弹性动力学 并行计算 负载平衡
下载PDF
三维爆炸与冲击问题的大规模高性能计算研究 被引量:12
11
作者 费广磊 马天宝 郝莉 《应用数学和力学》 CSCD 北大核心 2011年第3期357-364,共8页
爆炸与冲击问题常常涉及到材料的大变形、多种物质交界面处理及各种强间断的处理,对此类问题采用Euler方法具有显著的优势.对于Euler方法的并行计算,由于在扰动未到达之前某些网格的物理量是不发生变化的,采用固定分区方法并行策略容易... 爆炸与冲击问题常常涉及到材料的大变形、多种物质交界面处理及各种强间断的处理,对此类问题采用Euler方法具有显著的优势.对于Euler方法的并行计算,由于在扰动未到达之前某些网格的物理量是不发生变化的,采用固定分区方法并行策略容易出现负载不均衡,且计算效率不高.为解决这一问题,采用动态并行策略,即计算域随着扰动传播而扩充,并采用国际上通用的MPI并行模式设计出相应的动态并行程序.从程序测试结果来看,动态并行程序结果与原有并行程序结果一致,且与实际情况也是一致的. 展开更多
关键词 爆炸与冲击 动态并行 MPI 空中爆炸
下载PDF
分布式存储环境下非平衡刚性方程组的数值并行计算 被引量:6
12
作者 刘杰 胡庆丰 +1 位作者 韩国兴 迟利华 《计算物理》 CSCD 北大核心 2002年第1期86-88,共3页
采用非平衡刚性方程组的数值模拟计算来研究辐射的非平衡现象 ,分析了数值模拟计算过程中的并行性 ,提出一种负载平衡方法 ,为了增加数据局部性提出了一种多机串行计算方法 .给出相应的并行算法 ,分析了并行算法的通信复杂性 。
关键词 非平衡现象 数值并行计算 大量平衡刚性方程组 辐射 多机串行计算 分布式存储
下载PDF
列车与结构动态耦合分析的并行计算方法 被引量:8
13
作者 王建炜 金先龙 曹源 《计算力学学报》 EI CAS CSCD 北大核心 2012年第3期352-356,362,共6页
在分析结构动态响应时考虑列车与结构的动态耦合作用,采用详细三维有限元模型会带来计算量太大的问题。本文采用并行计算方法,根据列车与结构动态耦合模型的计算特点,设计实现了列车结构耦合均衡的分区算法,并以两个工程应用为例,利用... 在分析结构动态响应时考虑列车与结构的动态耦合作用,采用详细三维有限元模型会带来计算量太大的问题。本文采用并行计算方法,根据列车与结构动态耦合模型的计算特点,设计实现了列车结构耦合均衡的分区算法,并以两个工程应用为例,利用该方法对列车结构三维数值模型进行分区计算,结果表明该分区方法比递归坐标二分法有更好的并行效率。 展开更多
关键词 动态分析 三维模型 并行计算 区域分解方法
下载PDF
基于几何区域分解的三维输运问题并行迭代算法 被引量:6
14
作者 阳述林 莫则尧 沈隆钧 《计算物理》 CSCD 北大核心 2004年第1期1-9,共9页
 对三维直角坐标下的输运隐式差分方程,研究了基于几何区域分解的并行迭代算法,给出了串、并行迭代误差估计.并对相关数值结果进行了分析、比较.
关键词 输运方程 区域分解 并行迭代 误差估计 粒子输运 离散格式 差分离散
下载PDF
多重网格格子Boltzmann方法的并行算法 被引量:3
15
作者 刘智翔 宋安平 +2 位作者 徐磊 郑汉垣 张武 《计算机应用》 CSCD 北大核心 2014年第11期3065-3068,3072,共5页
针对复杂流动数值模拟中的格子Boltzmann方法存在计算网格量大、收敛速度慢的缺点,提出了基于三维几何边界的多重笛卡儿网格并行生成算法,并基于该网格生成方法提出了多重网格并行格子Boltzmann方法(LBM)。该方法结合不同尺度网格间的... 针对复杂流动数值模拟中的格子Boltzmann方法存在计算网格量大、收敛速度慢的缺点,提出了基于三维几何边界的多重笛卡儿网格并行生成算法,并基于该网格生成方法提出了多重网格并行格子Boltzmann方法(LBM)。该方法结合不同尺度网格间的耦合计算,有效减少了计算网格量,提高了收敛速度;而且测试结果也表明该并行算法具有良好的可扩展性。 展开更多
关键词 格子BOLTZMANN方法 多重网格 并行算法 可扩展性 OPENMP
下载PDF
二维柱几何中子输运方程的并行区域分解方法 被引量:6
16
作者 魏军侠 阳述林 傅连祥 《计算物理》 EI CSCD 北大核心 2010年第1期1-7,共7页
分析不同的区域分解方法及优先级插入算法对二维柱几何下中子输运方程Sn间断有限元方程并行效率的影响,给出基于最小面体比的正方形区域分解方法及沿径向的优先级插入算法,并通过将正方形区域分解方法与径向优先级插入算法进行组合,形... 分析不同的区域分解方法及优先级插入算法对二维柱几何下中子输运方程Sn间断有限元方程并行效率的影响,给出基于最小面体比的正方形区域分解方法及沿径向的优先级插入算法,并通过将正方形区域分解方法与径向优先级插入算法进行组合,形成新的算法.新算法更适应于二维柱几何下输运方程Sn间断有限元方法的并行计算.数值试验表明,在通信延迟较高的大型国产并行机上,新算法用数百个CPU还可以取得较好的并行效果,比已有方法具有更良好的可扩展性. 展开更多
关键词 输运方程 离散纵标法 间断有限元 区域分解 并行扫描算法
下载PDF
模糊多目标可靠性优化设计的遗传算法 被引量:7
17
作者 马成业 黎锁平 杨胜良 《兰州理工大学学报》 CAS 北大核心 2009年第1期156-158,共3页
给出模糊多目标可靠性优化设计的一个遗传算法.该方法利用模糊集隶属函数的特性将各子目标函数模糊化处理为能够反映各子目标相对重要程度,具有加权指数的协调满意度函数形式;通过加权函数将各子目标的协调满意度函数综合成统一的单目... 给出模糊多目标可靠性优化设计的一个遗传算法.该方法利用模糊集隶属函数的特性将各子目标函数模糊化处理为能够反映各子目标相对重要程度,具有加权指数的协调满意度函数形式;通过加权函数将各子目标的协调满意度函数综合成统一的单目标优化模型,用遗传算法求解模型.通过实例验证该方法的有效性. 展开更多
关键词 模糊目标 可靠性设计 遗传算法
下载PDF
数值天气预报与并行计算 被引量:5
18
作者 解以扬 庞璐 孟冬梅 《天津师范大学学报(自然科学版)》 CAS 2001年第4期65-69,共5页
从社会需求出发 ,论述了开展中尺度数值预报的重要性 ,及数值预报对高性能计算机的要求 ;介绍了中尺度气象模式 MM5的结构特征 ;给出中尺度模式的差分近似算法 ;
关键词 数值天气预报 中尺度模式 差分近似 并行计算 MMS 结构特征
下载PDF
基于MPI的分子对接并行算法 被引量:4
19
作者 常珊 孔韧 +2 位作者 李春华 陈慰祖 王存新 《计算物理》 EI CSCD 北大核心 2008年第2期241-246,共6页
基于消息传递接口(Message Passing Interface,MPI),用两种不同的并行程序设计方法对Autodock程序进行修改.将修改后的程序应用于HIV-1蛋白酶(Protease)和小分子抑制剂XK263的对接体系,测试了并行程序的加速比和并行效率.结果表明,两种... 基于消息传递接口(Message Passing Interface,MPI),用两种不同的并行程序设计方法对Autodock程序进行修改.将修改后的程序应用于HIV-1蛋白酶(Protease)和小分子抑制剂XK263的对接体系,测试了并行程序的加速比和并行效率.结果表明,两种改进的并行Autodock程序都可以很好地完成计算,尤其是方案Ⅱ并行程序的加速比和并行效率更高. 展开更多
关键词 分子对接 拉马克遗传算法 消息传递接口
下载PDF
遗传算法的早熟问题探究 被引量:18
20
作者 付旭辉 康玲 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第7期53-54,共2页
对遗传算法中的早熟问题进行了分析与探讨 ,针对遗传算法的模式定理提出了模式系数的概念 ,用以表征模式单调化的程度 .并通过模式系数影响变异概率 ,避免算法收敛时因模式单调化而造成算法早熟 .仿真计算表明 ,该方法能以较大的概率收... 对遗传算法中的早熟问题进行了分析与探讨 ,针对遗传算法的模式定理提出了模式系数的概念 ,用以表征模式单调化的程度 .并通过模式系数影响变异概率 ,避免算法收敛时因模式单调化而造成算法早熟 .仿真计算表明 ,该方法能以较大的概率收敛于全局最优解 . 展开更多
关键词 遗传算法 早熟 模式系数
下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部