期刊文献+
共找到242篇文章
< 1 2 13 >
每页显示 20 50 100
A Rayleigh Wave Globally Optimal Full Waveform Inversion Framework Based on GPU Parallel Computing
1
作者 Zhao Le Wei Zhang +3 位作者 Xin Rong Yiming Wang Wentao Jin Zhengxuan Cao 《Journal of Geoscience and Environment Protection》 2023年第3期327-338,共12页
Conventional gradient-based full waveform inversion (FWI) is a local optimization, which is highly dependent on the initial model and prone to trapping in local minima. Globally optimal FWI that can overcome this limi... Conventional gradient-based full waveform inversion (FWI) is a local optimization, which is highly dependent on the initial model and prone to trapping in local minima. Globally optimal FWI that can overcome this limitation is particularly attractive, but is currently limited by the huge amount of calculation. In this paper, we propose a globally optimal FWI framework based on GPU parallel computing, which greatly improves the efficiency, and is expected to make globally optimal FWI more widely used. In this framework, we simplify and recombine the model parameters, and optimize the model iteratively. Each iteration contains hundreds of individuals, each individual is independent of the other, and each individual contains forward modeling and cost function calculation. The framework is suitable for a variety of globally optimal algorithms, and we test the framework with particle swarm optimization algorithm for example. Both the synthetic and field examples achieve good results, indicating the effectiveness of the framework. . 展开更多
关键词 Full Waveform Inversion Finite-Difference Method Globally Optimal framework GPU parallel Computing Particle Swarm Optimization
下载PDF
Parallel Inference for Real-Time Machine Learning Applications
2
作者 Sultan Al Bayyat Ammar Alomran +3 位作者 Mohsen Alshatti Ahmed Almousa Rayyan Almousa Yasir Alguwaifli 《Journal of Computer and Communications》 2024年第1期139-146,共8页
Hyperparameter tuning is a key step in developing high-performing machine learning models, but searching large hyperparameter spaces requires extensive computation using standard sequential methods. This work analyzes... Hyperparameter tuning is a key step in developing high-performing machine learning models, but searching large hyperparameter spaces requires extensive computation using standard sequential methods. This work analyzes the performance gains from parallel versus sequential hyperparameter optimization. Using scikit-learn’s Randomized SearchCV, this project tuned a Random Forest classifier for fake news detection via randomized grid search. Setting n_jobs to -1 enabled full parallelization across CPU cores. Results show the parallel implementation achieved over 5× faster CPU times and 3× faster total run times compared to sequential tuning. However, test accuracy slightly dropped from 99.26% sequentially to 99.15% with parallelism, indicating a trade-off between evaluation efficiency and model performance. Still, the significant computational gains allow more extensive hyperparameter exploration within reasonable timeframes, outweighing the small accuracy decrease. Further analysis could better quantify this trade-off across different models, tuning techniques, tasks, and hardware. 展开更多
关键词 Machine Learning Models Computational Efficiency parallel Computing Systems Random Forest Inference Hyperparameter Tuning Python frameworks (TensorFlow PyTorch Scikit-Learn) High-Performance Computing
下载PDF
基于互信息和融合加权的并行深度森林算法 被引量:1
3
作者 毛伊敏 李文豪 《计算机应用研究》 CSCD 北大核心 2024年第2期473-481,共9页
针对大数据环境下并行深度森林算法中存在不相关及冗余特征过多、多粒度扫描不平衡、分类性能不足以及并行化效率低等问题,提出了基于互信息和融合加权的并行深度森林算法(parallel deep forest algorithm based on mutual information ... 针对大数据环境下并行深度森林算法中存在不相关及冗余特征过多、多粒度扫描不平衡、分类性能不足以及并行化效率低等问题,提出了基于互信息和融合加权的并行深度森林算法(parallel deep forest algorithm based on mutual information and mixed weighting,PDF-MIMW)。首先,在特征降维阶段提出了基于互信息的特征提取策略(feature extraction strategy based on mutual information,FE-MI),结合特征重要性、交互性和冗余性度量过滤原始特征,剔除过多的不相关和冗余特征;接着,在多粒度扫描阶段提出了基于填充的改进多粒度扫描策略(improved multi-granularity scanning strategy based on padding,IMGS-P),对精简后的特征进行填充并对窗口扫描后的子序列进行随机采样,保证多粒度扫描的平衡;其次,在级联森林构建阶段提出了并行子森林构建策略(sub-forest construction strategy based on mixed weighting,SFC-MW),结合Spark框架并行构建加权子森林,提升模型的分类性能;最后,在类向量合并阶段提出基于混合粒子群算法的负载均衡策略(load balancing strategy based on hybrid particle swarm optimization algorithm,LB-HPSO),优化Spark框架中任务节点的负载分配,降低类向量合并时的等待时长,提高模型的并行化效率。实验表明,PDF-MIMW算法的分类效果更佳,同时在大数据环境下的训练效率更高。 展开更多
关键词 Spark框架 并行深度森林 互信息 负载均衡
下载PDF
基于相对熵和余弦相似度的并行SVM算法
4
作者 毛伊敏 郭斌斌 +1 位作者 易见兵 陈志刚 《计算机集成制造系统》 EI CSCD 北大核心 2024年第9期3183-3198,共16页
针对大数据环境下并行支持向量机(SVM)算法存在子集分布偏差大,并行效率低以及过滤非支持向量不准确等问题,提出了基于相对熵和余弦相似度的并行SVM算法(RC-PSVM)。该算法首先提出基于相对熵的数据划分策略(DPRE),平衡当前子集和原始数... 针对大数据环境下并行支持向量机(SVM)算法存在子集分布偏差大,并行效率低以及过滤非支持向量不准确等问题,提出了基于相对熵和余弦相似度的并行SVM算法(RC-PSVM)。该算法首先提出基于相对熵的数据划分策略(DPRE),平衡当前子集和原始数据集的相对熵,划分样本到适合的子集,降低子集分布偏差;然后提出基于余弦相似度的冗余层级检测策略(CS-RLDS),计算相邻层局部SVM之间法向量的余弦相似度,比较设定的阈值与相似度,识别并停止冗余层级,提高了并行效率;最后提出非支持向量过滤策略(NSVF),结合样本到多个局部支持向量模型决策边界的距离,计算支持向量相似度来识别非支持向量,解决了过滤非支持向量不准确的问题。实验表明,RC-PSVM算法的分类效果更佳,且在大数据下的运行效率更高。 展开更多
关键词 大数据 MAPREDUCE框架 并行支持向量机 相对熵 余弦相似度
下载PDF
基于Spark和NRSCA策略的并行深度森林算法
5
作者 毛伊敏 刘绍芬 《计算机应用研究》 CSCD 北大核心 2024年第1期126-133,共8页
针对并行深度森林在大数据环境下存在冗余及无关特征过多、两端特征利用率过低、模型收敛速度慢以及级联森林并行效率低等问题,提出了基于Spark和NRSCA策略的并行深度森林算法——PDF-SNRSCA。首先,该算法提出了基于邻域粗糙集和Fisher ... 针对并行深度森林在大数据环境下存在冗余及无关特征过多、两端特征利用率过低、模型收敛速度慢以及级联森林并行效率低等问题,提出了基于Spark和NRSCA策略的并行深度森林算法——PDF-SNRSCA。首先,该算法提出了基于邻域粗糙集和Fisher score的特征选择策略(FS-NRS),通过衡量特征的相关性和冗余度,对特征进行过滤,有效减少了冗余及无关特征的数量;其次,提出了一种随机选择和等距提取的扫描策略(S-RSEE),保证了所有特征能够同概率被利用,解决了多粒度扫描两端特征利用率低的问题;最后,结合Spark框架,实现级联森林并行化训练,提出了基于重要性指数的特征筛选机制(FFM-II),筛选出非关键性特征,平衡增强类向量与原始类向量维度,从而加快模型收敛速度,同时设计了基于SCA的任务调度机制(TSM-SCA),将任务重新分配,保证集群负载均衡,解决了级联森林并行效率低的问题。实验表明,PDF-SNRSCA算法能有效提高深度森林的分类效果,且对深度森林并行化训练的效率也有大幅提升。 展开更多
关键词 并行深度森林算法 Spark框架 邻域粗糙集 正弦余弦算法 多粒度扫描
下载PDF
基于嵌入式操作系统的并行任务开发技术研究
6
作者 林卓 陈聪 王宏伟 《长江信息通信》 2024年第10期120-122,共3页
随着芯片开发技术在嵌入式系统中的发展,单位面积上晶体管数量不再无限制的增长,为追求嵌入式系统整体性能的提高,代码的执行效率逐渐被重视起来。多核处理器在嵌入式系统中应用越来越广泛,要进一步大规模地提高计算效率,更好的发挥出... 随着芯片开发技术在嵌入式系统中的发展,单位面积上晶体管数量不再无限制的增长,为追求嵌入式系统整体性能的提高,代码的执行效率逐渐被重视起来。多核处理器在嵌入式系统中应用越来越广泛,要进一步大规模地提高计算效率,更好的发挥出多核处理的优势,必须引入并行开发技术。文章采用openmp3.1作为并行框架,支持在嵌入式应用中进行c/c++语言开发,通过生成识别openmp指令的GCC4.8.1编译器,来解决openmp应用代码的编译问题,将openmp框架适配到嵌入式系统中,以可配置代码库的方式融入到操作系统应用层,深入分析openmp框架代码,提出了四个方面的优化策略,最后以FTD2000为目标机,多种算法作为测试用例,取得了优异的并行效果。 展开更多
关键词 嵌入式 并行 实时任务 openMP框架 优化技术
下载PDF
基于权参数优化的并行深度学习光伏功率预测 被引量:2
7
作者 董坤 冉鹏 +4 位作者 刘旭 樊钦洋 李政 曾庆华 李伟起 《动力工程学报》 CAS CSCD 北大核心 2024年第1期91-98,共8页
针对不同应用场景下光伏数据波动模式差异较大时,现有的光伏发电功率预测模型存在精度及适应性不足的问题,提出了一种具有权参数自适应性的并行深度学习光伏发电功率预测框架。该框架包含2种可以并行预测的深度学习算法单元(Attention-S... 针对不同应用场景下光伏数据波动模式差异较大时,现有的光伏发电功率预测模型存在精度及适应性不足的问题,提出了一种具有权参数自适应性的并行深度学习光伏发电功率预测框架。该框架包含2种可以并行预测的深度学习算法单元(Attention-Seq2Seq单元、Transformer单元)以及一个权参数自适应优化单元。基于所提出的并行深度学习框架,对光伏发电功率进行预测,并分别与Attention-Seq2Seq、Transformer模型的预测结果进行了对比验证。结果表明:基于权参数优化的并行深度学习光伏功率预测框架弥补了不同数据波动模式下单一算法预测精度和适应性不足的问题,也可以有效解决时间序列预测中的长距离依赖问题,较单一算法预测精度更高,其平均绝对误差和均方根误差在夏季典型日最大降幅分别是41.18%和45.59%,在冬季典型日最大降幅分别是81.13%和82.86%。 展开更多
关键词 光伏发电功率预测 权参数优化 并行深度学习框架 量子粒子群
下载PDF
基于种群混合迁移策略的并行量子遗传算法 被引量:1
8
作者 陆涛 管荑 +2 位作者 贾鹏 曲志坚 王子灵 《计算机工程与设计》 北大核心 2024年第8期2386-2392,共7页
针对量子遗传算法求解大规模优化问题存在收敛速度慢、易于陷入局部最优等问题,改进量子遗传算法。设计一种种群混合迁移机制促进算法的种群多样性,采用仿TriBA种群结构、双精英种群、重生种群、自适应迁移算子、个体竞争排挤算子以及... 针对量子遗传算法求解大规模优化问题存在收敛速度慢、易于陷入局部最优等问题,改进量子遗传算法。设计一种种群混合迁移机制促进算法的种群多样性,采用仿TriBA种群结构、双精英种群、重生种群、自适应迁移算子、个体竞争排挤算子以及随机失活机制,提高算法的局部勘测能力和全局寻优能力。利用Spark框架实现算法在分布式集群环境下的运算。改进2-opt&R优化算法,通过引入高斯变异提高算法的局部搜索能力,缩小算法的搜索空间。实验结果表明,改进后的算法在全局优化能力、收敛速度、运行速度和求解稳定性等方面均有大幅度提升。 展开更多
关键词 量子遗传算法 种群迁移 Spark框架 并行计算 收敛速度 全局优化 搜索空间
下载PDF
基于流计算和大数据平台的实时交通流预测 被引量:1
9
作者 李星辉 曾碧 魏鹏飞 《计算机工程与设计》 北大核心 2024年第2期553-561,共9页
目前交通流预测实时性差,很难满足在线分析和预测任务的需求,基于此提出一种Flink流计算框架和大数据平台结合的实时交通流预测方法。基于流计算框架实时捕捉和预处理数据,包括采用Flink的transform算子对数据进行校验和处理,将处理后... 目前交通流预测实时性差,很难满足在线分析和预测任务的需求,基于此提出一种Flink流计算框架和大数据平台结合的实时交通流预测方法。基于流计算框架实时捕捉和预处理数据,包括采用Flink的transform算子对数据进行校验和处理,将处理后的数据sink到大数据的HDFS文件系统,交由下一步的大数据并行框架进行分析建模与训练,实现基于流计算和大数据平台的实时交通流预测。实验结果表明,Flink能够实时捕捉和预处理交通流数据,把数据准时无误送入分布式文件系统中,在此基础上借助大数据框架下的并行分析和建模优势,在实时性数据分析与预测方面取得了较好的效果。 展开更多
关键词 大数据 数据并行 流计算框架 实时处理 交通流预测 分布式系统 实时性分析
下载PDF
一种面向舰船结构毁伤的大变形流固耦合数值计算方法
10
作者 王杰 王景焘 +3 位作者 黄超 伍洋 刘娜 张磐 《计算力学学报》 CAS CSCD 北大核心 2024年第2期335-343,共9页
水下爆炸导致舰船结构毁伤是一个复杂的非线性大变形流固耦合过程,高精度的流固耦合计算是获得高置信模拟结果的关键。基于浸没边界思想,本文提出一种面向大变形壳理论的流固耦合数值方法,可精确刻画流固耦合界面并高效求解流固界面约... 水下爆炸导致舰船结构毁伤是一个复杂的非线性大变形流固耦合过程,高精度的流固耦合计算是获得高置信模拟结果的关键。基于浸没边界思想,本文提出一种面向大变形壳理论的流固耦合数值方法,可精确刻画流固耦合界面并高效求解流固界面约束方程。基于该方法,本文提出了完整的适用于水下爆炸舰船结构毁伤的大变形流固耦合数值计算方案,并基于大规模并行编程框架,研发形成适用于舰船结构毁伤的流固耦合大规模并行计算软件。与泰勒平板理论解和水下爆炸结构冲击响应实验数据等进行对比表明,本文方法可有效模拟大变形流固耦合工程问题,具备较高数值求解精度。在此基础上,完成了水下爆炸整船结构毁伤过程大规模数值模拟。该方法可有效应用于舰船毁伤等级评估,应用前景广阔。 展开更多
关键词 大变形流固耦合 浸没边界法 舰船结构毁伤 并行编程框架
下载PDF
不同变形条件下锰铜合金的应力松弛特性及数值仿真 被引量:1
11
作者 熊亚军 刘艳 袁贤浦 《电子科技》 2024年第8期47-53,共7页
计算机运算能力的提升为有限元仿真分析提供支撑,可更高效地求解较复杂的结构及非线性问题。文中基于有限元仿真分析技术,针对锰铜合金复杂的力学特性进行仿真计算,分别采用Prony级数本构模型和并联流变本构模型对锰铜合金进行不同变形... 计算机运算能力的提升为有限元仿真分析提供支撑,可更高效地求解较复杂的结构及非线性问题。文中基于有限元仿真分析技术,针对锰铜合金复杂的力学特性进行仿真计算,分别采用Prony级数本构模型和并联流变本构模型对锰铜合金进行不同变形条件下的应力松弛实验仿真。通过提取应力松弛实验数据将其转化为相应模型参数并进行有限元仿真计算,获得可准确描述锰铜合金非线性力学特性的仿真模型参数。通过对比仿真和实验结果可知,并联流变模型能够更加准确地表征锰铜合金的应力松弛行为,在不同初始应变条件下,仿真结果和相应工况下的实验结果相对误差小于1%。并联流变模型比Prony级数模型更适用于锰铜合金在复杂工况下的仿真计算。 展开更多
关键词 锰铜合金 黏弹性 非线性 并联流变模型 Prony级数 有限元 应力松弛 仿真
下载PDF
Parallel algorithm of generating closure of RDFS source
12
作者 苗壮 张亚非 +1 位作者 陆建江 宋自林 《Journal of Southeast University(English Edition)》 EI CAS 2006年第3期435-438,共4页
To decrease the time of generating a closure, a parallel algorithm of generating the closure of a resource description framework schema (RDFS) source is presented. In the algorithm, RDFS triples in the source are cl... To decrease the time of generating a closure, a parallel algorithm of generating the closure of a resource description framework schema (RDFS) source is presented. In the algorithm, RDFS triples in the source are classified according to the forms of triples in the entailment rules and it reduces the scope of searching for specific triples. The dependence among the classes of triples is analyzed. Based on the classification, the initial RDFS source is partitioned into several subsets. The subsets are distributed to each process, and the closure is generated in parallel by applying the RDFS entailment rules. Parallel generating the closure of an RDFS source takes less time and increases efficiency. 展开更多
关键词 parallel CLOSURE resource description framework (RDF) graph RDFS source
下载PDF
启发式优化算法的GPU并行加速框架
13
作者 王东杰 温思歆 +1 位作者 孟万植 吴迪 《系统仿真学报》 CAS CSCD 北大核心 2024年第8期1929-1943,共15页
为解决启发式优化算法计算量大、耗时长的缺点,使用图形处理单元(GPU)以及统一计算架构(compute unified device architecture,CUDA)对启发式优化算法进行并行化。提出了一种针对启发式优化算法的GPU并行框架,设计了具有并行逻辑结构的... 为解决启发式优化算法计算量大、耗时长的缺点,使用图形处理单元(GPU)以及统一计算架构(compute unified device architecture,CUDA)对启发式优化算法进行并行化。提出了一种针对启发式优化算法的GPU并行框架,设计了具有并行逻辑结构的信息交互框架、算法并行优化策略,解决了信息交互的逻辑结构在串、并行中的相异性问题,该框架可并行化各类启发式优化算法,具有一般性与高效性。为验证该框架的有效性,利用并行框架对5种常见启发式优化算法进行并行化,给出了多个测试函数下GPU并行计算与CPU串行计算的对比结果,其中差分进化算法、哈里斯鹰优化算法、灰狼优化算法、鲸鱼优化算法在种群维度为5000时,分别加速高达179.1、178.6、74.3、358.2倍,同时保证了结果的准确性,表明所设计并行框架的高效性与实用性。 展开更多
关键词 启发式优化算法 GPU并行 CUDA模型 并行框架 信息交互
下载PDF
基于Spark的叠加能量寻优反射波剩余静校正算法的工程化实现
14
作者 袁联生 《石油物探》 CSCD 北大核心 2024年第4期807-816,共10页
叠加能量寻优反射波剩余静校正方法是解决剩余静校正问题的有效方法之一,该方法精度高,但计算量大且需要进行多域数据切换。随着原始数据量的不断增长,其算法实现的高效运行成为主要的应用瓶颈问题。分析了叠加能量寻优反射波剩余静校... 叠加能量寻优反射波剩余静校正方法是解决剩余静校正问题的有效方法之一,该方法精度高,但计算量大且需要进行多域数据切换。随着原始数据量的不断增长,其算法实现的高效运行成为主要的应用瓶颈问题。分析了叠加能量寻优反射波剩余静校正方法计算密集、通讯密集的特征,针对算法难以实现并行计算的难点,提出了基于Spark分布式内存计算模型的技术解决方案,实现了海量地震数据弹性分布式数据集的高效流转和多域数据的灵活切换,完成了叠加能量寻优反射波剩余静校正方法的多节点分布式并行计算,提高了大数据情形下方法的适应性和计算效率,提升了其在地震数据处理中的实用化程度。实际生产数据的应用结果表明,基于Spark的叠加能量寻优反射波剩余静校正的软件模块在复杂近地表地震数据的处理中取得了能满足实际生产要求的应用效果,兼具适应性强和计算效率高的特点。 展开更多
关键词 反射波剩余静校正 Spark框架 工程化实现 分布式并行计算
下载PDF
锰铜阻尼合金的非线性力学特性特征参数确定方法
15
作者 张斌 张凌翔 +1 位作者 刘艳 熊亚军 《噪声与振动控制》 CSCD 北大核心 2024年第3期75-81,共7页
锰铜阻尼合金非线性力学特性的特征变化规律已被广泛研究,但如何通过仿真准确描述其非线性力学行为,并对由其制成的结构件进行设计与优化,是对其进行工程应用研究的前提与关键。基于超弹性模型和并联流变模型(Parallel Rheological Fram... 锰铜阻尼合金非线性力学特性的特征变化规律已被广泛研究,但如何通过仿真准确描述其非线性力学行为,并对由其制成的结构件进行设计与优化,是对其进行工程应用研究的前提与关键。基于超弹性模型和并联流变模型(Parallel Rheological Framework,PRF),描述一种典型孪晶型阻尼合金材料的非线性力学特性,重点讨论由单轴拉伸试验和动态机械分析(Dynamic Mechanical Analysis,DMA)试验确定PRF模型特征参数的方法:通过拟合单轴拉伸试验数据得到超弹性模型参数;基于多应变DMA三点弯曲频率扫描实验,通过实验数据拟合得到线性黏弹性Prony级数模型,通过PRF模型进行参数转换,将线性黏弹性模型参数转化为非线性PRF模型初始参数;结合超弹性模型,采用Isight软件对PRF模型参数进行优化,确定锰铜阻尼合金的非线性力学特性特征参数;最后,在Ω型锰铜阻尼合金支座的顶部施加竖向扫频激励,通过扫频试验数据和仿真计算结果对比,验证该锰铜阻尼合金材料的非线性力学模型在实际仿真应用中的可靠性。结果表明,PRF模型可较好模拟锰铜阻尼合金非线性动态力学行为,为锰铜阻尼合金结构设计提供更高精度的仿真结果。 展开更多
关键词 振动与波 锰铜阻尼合金 应变幅值相关性 非线性 有限元仿真 并联流变模型
下载PDF
分布式智能协同测试系统体系架构研究
16
作者 张鹏 史贤俊 +2 位作者 吕佳朋 谷旭平 张志亮 《舰船电子工程》 2024年第9期161-164,192,共5页
为解决我军现有测试设备对武器装备进行测试时存在测试周期较长和现有测试设备体积庞大敏捷性差的问题,基于分布式作战理念,在装备测试领域提出分布式智能协同测试(Distributed Intelligent Collaboration Testing,DICT)的概念,对分布... 为解决我军现有测试设备对武器装备进行测试时存在测试周期较长和现有测试设备体积庞大敏捷性差的问题,基于分布式作战理念,在装备测试领域提出分布式智能协同测试(Distributed Intelligent Collaboration Testing,DICT)的概念,对分布式智能协同测试系统的体系架构进行了研究,以装备测试敏捷性、灵活性和扩展性为设计原则,对分布式智能协同测试系统的体系架构进行分析,改进了现有测试设备的物理结构,消除了阻碍测试系统并行测试的结构障碍,指导测试系统基于分布式作战环境向低成本、可重构、小型化转型发展,实现多弹型、多任务并行测试保障。 展开更多
关键词 分布式 协同测试 系统框架结构 自动测试系统 并行测试
下载PDF
Forward and backward models for fault diagnosis based on parallel genetic algorithms 被引量:10
17
作者 Yi LIU Ying LI +1 位作者 Yi-jia CAO Chuang-xin GUO 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2008年第10期1420-1425,共6页
In this paper, a mathematical model consisting of forward and backward models is built on parallel genetic algorithms (PGAs) for fault diagnosis in a transmission power system. A new method to reduce the scale of faul... In this paper, a mathematical model consisting of forward and backward models is built on parallel genetic algorithms (PGAs) for fault diagnosis in a transmission power system. A new method to reduce the scale of fault sections is developed in the forward model and the message passing interface (MPI) approach is chosen to parallel the genetic algorithms by global sin-gle-population master-slave method (GPGAs). The proposed approach is applied to a sample system consisting of 28 sections, 84 protective relays and 40 circuit breakers. Simulation results show that the new model based on GPGAs can achieve very fast computation in online applications of large-scale power systems. 展开更多
关键词 Forward and backward models Fault diagnosis Global single-population master-slave genetic algorithms (GPGAs) parallel computation
下载PDF
Review of the algebraic linear methods and parallel implementation in numerical simulation of groundwater flow 被引量:1
18
作者 CHENG Tang-pei LIU Xing-wei +1 位作者 SHAO Jing-Li CUI Ya-li 《Journal of Groundwater Science and Engineering》 2016年第1期12-17,共6页
The desire to increase spatial and temporal resolution in modeling groundwater system has led to the requirement for intensive computational ability and large memory space. In the course of satisfying such requirement... The desire to increase spatial and temporal resolution in modeling groundwater system has led to the requirement for intensive computational ability and large memory space. In the course of satisfying such requirement, parallel computing has played a core role over the past several decades. This paper reviews the parallel algebraic linear solution methods and the parallel implementation technologies for groundwater simulation. This work is carried out to provide guidance to enable modelers of groundwater systems to make sensible choices when developing solution methods based upon the current state of knowledge in parallel computing. 展开更多
关键词 GROUNDWATER flow simulation parallel ALGEBRAIC algorithms Krylov subspacemethods PRECONDITIONING GPU COMPUTING parallel COMPUTING framework
下载PDF
Programming for scientific computing on peta-scale heterogeneous parallel systems 被引量:1
19
作者 杨灿群 吴强 +2 位作者 唐滔 王锋 薛京灵 《Journal of Central South University》 SCIE EI CAS 2013年第5期1189-1203,共15页
Peta-scale high-perfomlance computing systems are increasingly built with heterogeneous CPU and GPU nodes to achieve higher power efficiency and computation throughput. While providing unprecedented capabilities to co... Peta-scale high-perfomlance computing systems are increasingly built with heterogeneous CPU and GPU nodes to achieve higher power efficiency and computation throughput. While providing unprecedented capabilities to conduct computational experiments of historic significance, these systems are presently difficult to program. The users, who are domain experts rather than computer experts, prefer to use programming models closer to their domains (e.g., physics and biology) rather than MPI and OpenME This has led the development of domain-specific programming that provides domain-specific programming interfaces but abstracts away some performance-critical architecture details. Based on experience in designing large-scale computing systems, a hybrid programming framework for scientific computing on heterogeneous architectures is proposed in this work. Its design philosophy is to provide a collaborative mechanism for domain experts and computer experts so that both domain-specific knowledge and performance-critical architecture details can be adequately exploited. Two real-world scientific applications have been evaluated on TH-IA, a peta-scale CPU-GPU heterogeneous system that is currently the 5th fastest supercomputer in the world. The experimental results show that the proposed framework is well suited for developing large-scale scientific computing applications on peta-scale heterogeneous CPU/GPU systems. 展开更多
关键词 heterogeneous parallel system programming framework scientific computing GPU computing molecular dynamic
下载PDF
Study on the Servo Drive of PM-LSM to Be Used in Parallel Synchronous Drive 被引量:1
20
作者 Hiroyuki Takai Suzuki Kenji Hideo Dohmeki 《Journal of Mechanics Engineering and Automation》 2015年第10期580-584,共5页
Recently, linear motors can have high speed control, high acceleration-deceleration. So linear motors are widely used in industrial applications such as precision machine tools. In our laboratory focusing on transport... Recently, linear motors can have high speed control, high acceleration-deceleration. So linear motors are widely used in industrial applications such as precision machine tools. In our laboratory focusing on transport system, we propose parallel synchronous drive of used the PM-LSM (permanent magnet linear synchronous motor). It can pass luggage without having to stop the working. When you establish "parallel synchronous drive", a motor follows the other motor. In our laboratory, one of the motors is called "master motor" and the other motor called "slave motor". The master motor's speed and position pass slave motor then establish parallel synchronous drive. Therefore, slave motor requires high-responsive and precision that follows the master motor. This paper focuses on the control of the slave motor. 展开更多
关键词 PM-LSM master-slave motor PI control parallel synchronous drive method.
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部