期刊文献+
共找到982篇文章
< 1 2 50 >
每页显示 20 50 100
间断Galerkin有限元隐式算法GPU并行化研究
1
作者 高缓钦 陈红全 +1 位作者 贾雪松 徐圣冠 《空气动力学学报》 CSCD 北大核心 2024年第2期21-33,I0001,共14页
为了提高间断伽辽金(discontinuous Galerkin,DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit,GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题... 为了提高间断伽辽金(discontinuous Galerkin,DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit,GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题,时间推进选用下上对称高斯-赛德尔(lower-upper symmetric Gauss-Seidel,LU-SGS)隐式格式。为了克服传统隐式格式固有的数据关联依赖问题,借助于本文提出的面向任意网格的单元着色分组技术,先给出了LUSGS隐式格式的并行化改造,使得隐式时间推进能按颜色组别依次并行,由于同一颜色组内算法已不存在数据关联,可以据此实现并行化。在此基础上,再结合DG算法局部紧致等特点,基于统一计算设备架构(compute unified device architecture,CUDA)编程模型,设计了依据单元的核函数,并构建了对应的线程与数据结构,给出了DG有限元隐式GPU并行算法。最后,发展的算法通过了多个二维和三维典型流动算例考核与性能测试,展示出隐式算法GPU加速的效果,且获得的计算结果能与现有的文献或实验数据接近。 展开更多
关键词 间断伽辽金方法 LU-SGS隐式格式 GPU并行化 单元着色分组 EULER方程
下载PDF
基于流水线网络的地表水动态模拟及并行化研究
2
作者 吴钱娇 《测绘学报》 EI CSCD 北大核心 2024年第1期199-199,共1页
由于自然环境演变、气候变化、人类活动的变迁和植被覆盖率的降低,遇到连续强降雨或暴风雨后,地表水的急速流动极易引起洪涝灾害,对人们的生活、社会的生产与自然环境造成了直接或潜在的重大危害。因此,如何快速高精度地模拟地表水动态... 由于自然环境演变、气候变化、人类活动的变迁和植被覆盖率的降低,遇到连续强降雨或暴风雨后,地表水的急速流动极易引起洪涝灾害,对人们的生活、社会的生产与自然环境造成了直接或潜在的重大危害。因此,如何快速高精度地模拟地表水动态过程是防灾减灾中亟待解决的任务。 展开更多
关键词 气候变 洪涝灾害 植被覆盖率 动态模拟 防灾减灾 自然环境演变 并行化 强降雨
下载PDF
基于BIM的建筑工程项目公司级与项目级并行化管理平台研究
3
作者 冯鸣 许家铭 朱姣兰 《建筑经济》 2024年第3期40-47,共8页
针对大多数工程建设项目管理平台无法实现公司级与项目级工程信息的双向传递,本文利用B/S系统架构自主开发一套基于BIM模型的建筑工程并行化管理平台。该平台通过两套Web服务搭建公司级和项目级并行化管理系统架构,利用GPU虚拟化和WebRT... 针对大多数工程建设项目管理平台无法实现公司级与项目级工程信息的双向传递,本文利用B/S系统架构自主开发一套基于BIM模型的建筑工程并行化管理平台。该平台通过两套Web服务搭建公司级和项目级并行化管理系统架构,利用GPU虚拟化和WebRTC通信技术完成BIM信息轻量化处理,并按照接口协议完成信息在公司级和项目级两级服务器上的有效传输,实现公司级与项目级并行化管理。以某项目工程为例,分析该平台在建设工程项目并行化管理中的应用,以期为提升建筑工程项目信息化管理水平提供参考。 展开更多
关键词 企业管理 建筑工程 并行化管理 BIM 工程项目管理平台
下载PDF
基于并行化诱导排序快速实现Burrows-Wheeler变换算法
4
作者 窦岩 《电脑知识与技术》 2024年第11期36-38,共3页
为解决生物序列比对算法中主流索引技术Burrows-Wheeler变换(BWT)构建索引效率低的问题,文章提出了一种利用并行化诱导排序改进BWT索引构建的方法。首先,该研究充分发挥诱导排序的线性时间复杂度优势,高效地建立后缀数组。其次,基于此,... 为解决生物序列比对算法中主流索引技术Burrows-Wheeler变换(BWT)构建索引效率低的问题,文章提出了一种利用并行化诱导排序改进BWT索引构建的方法。首先,该研究充分发挥诱导排序的线性时间复杂度优势,高效地建立后缀数组。其次,基于此,采用并行化优化算法对后缀类型和子串处理过程进行优化。最后,通过与主流算法在真实生物数据集上的对比实验,结果显示,经过优化的算法在索引构建速度上相较于传统算法取得了明显的提升,从而证明了该方法的有效性。 展开更多
关键词 BWT索引 后缀数组 诱导排序 并行化
下载PDF
基于多线程技术的C语言程序并行化改造
5
作者 王永红 《电脑知识与技术》 2024年第10期64-67,共4页
针对C语言单线程程序在多核处理器上存在的性能瓶颈、局限性和响应时间延迟问题,基于多线程技术的并行化改造显得尤为重要。该研究通过深入分析多线程技术的基础知识,包括线程的创建与管理、同步与互斥机制等,设计了一套并行化改造策略... 针对C语言单线程程序在多核处理器上存在的性能瓶颈、局限性和响应时间延迟问题,基于多线程技术的并行化改造显得尤为重要。该研究通过深入分析多线程技术的基础知识,包括线程的创建与管理、同步与互斥机制等,设计了一套并行化改造策略和任务划分方法。进而,对数据结构和算法进行并行化优化,实现了线程间的有效通信与协作。文章基于Pthreads库,详细阐述了多线程功能的分析及实现过程,并设计并实现了一个高效的多线程C语言程序。通过并行化改造,程序在多核处理器上的执行效率和响应能力得到了显著提升,验证了多线程技术在优化C语言程序性能方面的有效性和潜力。 展开更多
关键词 C语言 多线程技术 并行化改造 性能优 Pthreads库
下载PDF
基于Spark的扩展孤立森林算法并行化改造实验设计
6
作者 应文豪 孙中强 +2 位作者 王诗愉 钟珊 龚声蓉 《实验技术与管理》 CAS 北大核心 2023年第4期75-81,共7页
针对海量或高维数据进行异常检测实验时,往往检测速度较慢、效率较低。针对此问题,设计了一种基于Spark分布式计算的扩展孤立森林异常检测算法改造实验。实验基于Spark框架,分别在数据抽样、训练、预测等阶段设计并行化改造方法,通过与... 针对海量或高维数据进行异常检测实验时,往往检测速度较慢、效率较低。针对此问题,设计了一种基于Spark分布式计算的扩展孤立森林异常检测算法改造实验。实验基于Spark框架,分别在数据抽样、训练、预测等阶段设计并行化改造方法,通过与单核条件下的算法对比,验证了并行化方法在保证准确性的前提下执行效率得到大大提高。此实验对加深学生对大数据分布式并行处理知识的理解,引导其对海量数据挖掘相关技术的学习兴趣具有积极作用。 展开更多
关键词 大数据并行化 异常检测 孤立森林 数据挖掘 实验设计
下载PDF
基于LLVM Pass的复杂嵌套循环自动并行化框架
7
作者 马春燕 吕炳旭 +1 位作者 叶许姣 张雨 《软件学报》 EI CSCD 北大核心 2023年第7期3022-3042,共21页
随着多核处理器的普及应用,针对嵌入式遗留系统中串行代码的自动并行化方法是研究热点.其中,针对具有非完美嵌套结构、非仿射依赖关系特征的复杂嵌套循环的自动并行化方法存在技术挑战.提出了一种基于LLVMPass的复杂嵌套循环的自动并行... 随着多核处理器的普及应用,针对嵌入式遗留系统中串行代码的自动并行化方法是研究热点.其中,针对具有非完美嵌套结构、非仿射依赖关系特征的复杂嵌套循环的自动并行化方法存在技术挑战.提出了一种基于LLVMPass的复杂嵌套循环的自动并行化框架(CNLPF).首先,提出了一种复杂嵌套循环的表示模型,即循环结构树,并将嵌套循环的正则区域自动转换为循环结构树表示;然后,对循环结构树进行数据依赖分析,构建循环内和循环间的依赖关系;最后,基于OpenMP共享内存的编程模型生成并行的循环程序.针对SPEC2006数据集中包含近500个复杂嵌套循环的6个程序案例,分别对其进行复杂嵌套循环占比统计和并行性能加速测试.结果表明,提出的自动并行化框架可以处理LLVMPolly无法优化的复杂嵌套循环,增强了LLVM的并行编译优化能力,且该方法结合Polly的组合优化,比单独采用Polly优化的加速效果提升了9%-43%. 展开更多
关键词 复杂嵌套循环 自动并行化 LLVM Pass 依赖分析
下载PDF
基于云边协同的决策树并行化设计
8
作者 姚跃 《无线互联科技》 2023年第2期55-57,102,共4页
随着海量数据的分析任务越来越重,数据挖掘工作需要进一步推进和优化。文章首先提出了基于云边协同的决策树并行化设计,根据连续属性离散化判断分裂属性,在属性确认之后建立决策树;其次对并行化设计内的数据进行预处理,构建决策树整体... 随着海量数据的分析任务越来越重,数据挖掘工作需要进一步推进和优化。文章首先提出了基于云边协同的决策树并行化设计,根据连续属性离散化判断分裂属性,在属性确认之后建立决策树;其次对并行化设计内的数据进行预处理,构建决策树整体并行流程;最终实现数据的实时分析与智能处理。对比试验表明,基于云边协同的决策树算法连续属性离散化的优化,在保证准确率的基础上,能有效地缩短运算时间,提高算法的运算速度。 展开更多
关键词 云边协同 决策树 并行化 边缘算法 属性相似度 数据处理
下载PDF
PRESTO单脉冲搜索的算法优化及其并行化
9
作者 傅志明 陈宗浩 +4 位作者 梁楠 于徐红 邵广盛 张彬 谢晓尧 《天文研究与技术》 CSCD 2023年第2期145-153,共9页
随着快速射电暴(Fast Radio Burst,FRB)及旋转射电暂现源(Rotating Radio Transient,RRAT)等一些没有明显周期的天体被发现以来,单脉冲搜索受到研究人员广泛关注。同时随着射电望远镜设备日趋完善,更高分辨率和更广阔的观测空间产生的... 随着快速射电暴(Fast Radio Burst,FRB)及旋转射电暂现源(Rotating Radio Transient,RRAT)等一些没有明显周期的天体被发现以来,单脉冲搜索受到研究人员广泛关注。同时随着射电望远镜设备日趋完善,更高分辨率和更广阔的观测空间产生的观测数据量剧增,观测数据的快速处理迫在眉睫。介绍了PRESTO(PulsaR Exploration and Search TOolkit)中单脉冲搜索,使用Cython编程方式对单脉冲搜索中去趋势(Detrend)算法进行优化,并通过Ray框架实现单脉冲搜索在中央处理器(Central Processing Units,CPU)上并行化。实验结果表明,算法优化后的单脉冲搜索并行化,能明显提升搜索程序性能,显著缩短数据处理时间,同时该并行策略仅基于中央处理器,无需修改代码即可在纯中央处理器环境下实现高性能数据处理。 展开更多
关键词 单脉冲搜索 脉冲星 并行化
下载PDF
可重构阵列处理器上HEVC流水线并行化设计与实现
10
作者 赵静 蒋林 +3 位作者 朱筠 谢晓燕 杨坤 崔馨月 《传感器与微系统》 CSCD 北大核心 2023年第10期95-98,102,共5页
为了解决新一代高效视频编码(HEVC)标准中计算复杂度大幅增加导致的编码速度降低问题和专用硬件实现编码器灵活性差的问题,提出了一种基于可重构阵列处理器的HEVC流水线并行化实现方法。该方法将编码块的处理过程划分为不同的流水线等级... 为了解决新一代高效视频编码(HEVC)标准中计算复杂度大幅增加导致的编码速度降低问题和专用硬件实现编码器灵活性差的问题,提出了一种基于可重构阵列处理器的HEVC流水线并行化实现方法。该方法将编码块的处理过程划分为不同的流水线等级,根据算法特性设计流水线并行映射方案,并基于可重构阵列处理器的握手机制设计流水线调度方式,使得同一时刻各流水级并行处理不同的编码块,从而加速视频图像的编码过程。实验结果表明:该方案与非流水线实现相比,编码时间减少了约66%;与在现场可编程门阵列(FPGA)上通过模式决策并行化实现加速的方案相比,编码时间减少了18%;与HEVC官方测试模型HM16.8相比,平均PSNR值增加了0.0219 dB。 展开更多
关键词 高效视频编码 流水线 阵列处理器 并行化 可重构
下载PDF
面向水利监管的违采事件检测并行化方法研究
11
作者 马斌 徐海军 陈嘉靖 《人民黄河》 CAS 北大核心 2023年第10期122-125,共4页
现有卷积神经网络检测方法不能满足高检测精度和速度的要求。针对此不足,利用卷积神经网络选取目标检测算法,以DarkNet53网络模型为基础,结合黄河流域违采事件特点,对模型加入并行化设计,以检测速度和检测精度为评价指标,利用对比实验... 现有卷积神经网络检测方法不能满足高检测精度和速度的要求。针对此不足,利用卷积神经网络选取目标检测算法,以DarkNet53网络模型为基础,结合黄河流域违采事件特点,对模型加入并行化设计,以检测速度和检测精度为评价指标,利用对比实验验证并行化后的HO-DarkNet网络模型的加速效果。结果表明:并行化前HO-DarkNet模型的精确率约75%、召回率约96%、mAP@0.5为98.58%、mAP@0.5∶0.95为64.25%,与DarkNet53模型相比,并行化前HO-DarkNet模型的mAP@0.5、mAP@0.5∶0.95值分别提升了7.98%、8.79%;与并行处理前HO-DarkNet模型相比,并行处理后HO-DarkNet模型的mAP精度值未发生太大变化,但其加速比提高了2.32,对于视频图像的处理速度为21 fps/s,达到视频图像处理速度标准。 展开更多
关键词 HO-DarkNet模型 水利监管 违采事件检测 并行化 黄河
下载PDF
应用禁忌粒子群算法的车间调度及其并行化实现
12
作者 郑天华 王佳斌 +1 位作者 蔡宇翔 彭凯 《华侨大学学报(自然科学版)》 CAS 2023年第1期104-110,共7页
为了解决批量生产、制造、装配等车间调度问题,基于Hadoop集群,提出应用禁忌粒子群算法的车间调度及其并行化实现.以某装载机制造车间最小化完成时间为目标,通过使用禁忌粒子群算法对车间调度问题进行求解.结果表明:在车间批量大的情况... 为了解决批量生产、制造、装配等车间调度问题,基于Hadoop集群,提出应用禁忌粒子群算法的车间调度及其并行化实现.以某装载机制造车间最小化完成时间为目标,通过使用禁忌粒子群算法对车间调度问题进行求解.结果表明:在车间批量大的情况下,禁忌粒子群算法可得出有效的调度方案,避免算法陷入局部最优解.与现有的智能算法相比,禁忌粒子群算法更有利于实现全局最优解. 展开更多
关键词 车间调度 并行化 禁忌粒子群算法 智能算法 HADOOP集群
下载PDF
程序自动并行化系统 被引量:34
13
作者 朱传琪 臧斌宇 陈彤 《软件学报》 EI CSCD 北大核心 1996年第3期180-186,共7页
有效的自动并行化系统能帮助用户充分地利用并行计算机资源.本文介绍了自动并行化的历史及现状,并着重介绍了作者所开发的自动并行化系统AFT(automaticFortrantransformer)及其特色和所用的关键技术... 有效的自动并行化系统能帮助用户充分地利用并行计算机资源.本文介绍了自动并行化的历史及现状,并着重介绍了作者所开发的自动并行化系统AFT(automaticFortrantransformer)及其特色和所用的关键技术.测试结果表明AFT系统在功能上已超越了传统的自动并行化系统. 展开更多
关键词 程序并行化 并行计算机 自动并行化系统
下载PDF
自动寻找使多重串行循环并行化的幺模变换 被引量:3
14
作者 俞一峻 臧斌宇 +1 位作者 施武 朱传琪 《软件学报》 EI CSCD 北大核心 1999年第4期366-371,共6页
对于已知n维距离向量矩阵的多重串行循环,过去的并行化编译研究还缺乏寻找使循环外层并行化的幺模矩阵的可行算法.文章介绍了多重串行循环并行化的幺模变换方法,不仅从理论上证明满足外层并行化要求的合法幺模矩阵是存在的,而且通... 对于已知n维距离向量矩阵的多重串行循环,过去的并行化编译研究还缺乏寻找使循环外层并行化的幺模矩阵的可行算法.文章介绍了多重串行循环并行化的幺模变换方法,不仅从理论上证明满足外层并行化要求的合法幺模矩阵是存在的,而且通过构造性证明给出一个计算外层并行化幺模变换矩阵的可行算法,并探讨了扩大其适用范围于非完全嵌套和非常数相关距离循环的有效途径. 展开更多
关键词 自动并行化变换 幺模变换 并行化编译
下载PDF
面向CFD的交互式并行化系统Paractive 被引量:3
15
作者 丁晓宁 傅游 康继昌 《计算机工程与应用》 CSCD 北大核心 2002年第17期79-81,84,共4页
该文介绍了面向计算流体力学(CFD)的交互式并行化系统Paractive以及Paractive系统实现时所采用的关键技术。该文根据CFD程序及其并行化的特点提出了CFD程序并行化的区域计算模型以及区域相关的概念。区域计算模型将CFD程序看成区域操作... 该文介绍了面向计算流体力学(CFD)的交互式并行化系统Paractive以及Paractive系统实现时所采用的关键技术。该文根据CFD程序及其并行化的特点提出了CFD程序并行化的区域计算模型以及区域相关的概念。区域计算模型将CFD程序看成区域操作的有序组合,区域相关则以区域操作为基本单位,区域操作本身所具有的对大块数据进行整体操作的特点,使得区域计算模型和区域相关非常适合开发CFD程序中蕴含的数据并行性。另外,该文还介绍了基于程序对象树的增量分析技术以及CFD程序并行化的静态性能预测技术,并在最后给出了使用Paractive并行化CFD实际算例的测试数据。 展开更多
关键词 CFD 交互式并行化系统 Paractive 区域计算模型 增量分析 程序自动并行化
下载PDF
基于OpenCL的AES算法并行化研究
16
作者 王阳 《自动化应用》 2023年第14期241-244,247,共5页
军用电子信息系统网络化带来的数据交互需使用安全传输技术保证交互过程的安全性。传统的加密方式带来的传输时延影响了系统的实时性,本文研究基于OpenCL的AES算法并行化技术,为安全传输提供快速加密的技术支撑。通过对AES算法并行化的... 军用电子信息系统网络化带来的数据交互需使用安全传输技术保证交互过程的安全性。传统的加密方式带来的传输时延影响了系统的实时性,本文研究基于OpenCL的AES算法并行化技术,为安全传输提供快速加密的技术支撑。通过对AES算法并行化的研究分析,设计T盒取代原有的S盒替换、行位移、列混合的数据块加密操作。通过多粒度加密方式对比、内存分配对比实验找出最优化的存储策略和并行粒度,使得优化后的AES算法在同等硬件环境下取得了最大3.74的加速比,能适用于安全传输且满足系统实时性的需求。 展开更多
关键词 OPENCL 安全传输 AES算法 并行化
下载PDF
基于内存并行化聚类的用户用电行为分析
17
作者 黄东升 郭崇 《信息技术与信息化》 2023年第7期116-118,122,共4页
针对经典K-means选取初始值具有一定的盲目性和不确定性,提出了基于Canopy+算法的改进K-means聚类算法。首先对实验数据进行预处理,并从每条日负荷数据提取六个特征值;然后搭建Spark大数据集群,利用集群具有的内存并行化特点,提升改进... 针对经典K-means选取初始值具有一定的盲目性和不确定性,提出了基于Canopy+算法的改进K-means聚类算法。首先对实验数据进行预处理,并从每条日负荷数据提取六个特征值;然后搭建Spark大数据集群,利用集群具有的内存并行化特点,提升改进聚类算法处理大规模数据的能力;最后将预处理后的用户日负荷数据进行单机K-means以及改进后算法的集群聚类。实验结果表明,在降低迭代次数的基础上,改进后集群聚类算法误差平方和降低3 659.906、轮廓系数提高0.03、DB指数下降0.06。使用改进后算法将电力用户划分为五个类别,其中具有调峰潜力、较优质的需求侧响应用户为第5类用户。 展开更多
关键词 分时电价 用电行为 内存并行化 大数据平台 聚类分析
下载PDF
基于Spark并行化的改进K-means轨迹聚类的方法
18
作者 孙明悦 马胤垚 《数字技术与应用》 2023年第10期112-114,共3页
本文设计了一种对K-means初始化改进的Canopy+Kmeans++聚类方法,提高上轨迹聚类算法的效率,为进一步提升轨迹大数据聚类的迭代计算效率,本文利用Spark计算架构的可伸缩性和分布式等特,实现Canopy+K-means++轨迹聚类算法的并行化,并通过... 本文设计了一种对K-means初始化改进的Canopy+Kmeans++聚类方法,提高上轨迹聚类算法的效率,为进一步提升轨迹大数据聚类的迭代计算效率,本文利用Spark计算架构的可伸缩性和分布式等特,实现Canopy+K-means++轨迹聚类算法的并行化,并通过对比实验来证明该并行化聚类方案的有效性。 展开更多
关键词 轨迹聚类 聚类算法 可伸缩性 并行化 迭代计算 聚类方法 初始 CANOPY
下载PDF
SPMD型程序的自动并行化 被引量:1
19
作者 冯百明 肖骊 +1 位作者 况正谦 康继昌 《西北师范大学学报(自然科学版)》 CAS 1999年第2期10-14,共5页
介绍了基于共享变量的SPMD型程序自动并行化模型,给出了从串行源程序生成以EP860并行计算机系统为运行环境的并行程序源程序的过程,并详细讨论了一些关键技术和实现方法.
关键词 自动并行化 程序并行化 SPMD型程序 程序自动
下载PDF
基于Parallel studio的视频编解码并行化优化
20
作者 杨川 杨斌 +1 位作者 李刚 李杰 《微计算机应用》 2010年第3期42-46,共5页
随着计算机技术的不断发展,人们对多媒体技术的实时性有了更高的要求,特别是视频编解码的时间效率。另外,随着多核CPU及相关技术的不断普及,使得原有非并行化程序的性能的不足显现了出来,因此对传统程序的并行化迫在眉睫。本文以目前较... 随着计算机技术的不断发展,人们对多媒体技术的实时性有了更高的要求,特别是视频编解码的时间效率。另外,随着多核CPU及相关技术的不断普及,使得原有非并行化程序的性能的不足显现了出来,因此对传统程序的并行化迫在眉睫。本文以目前较流行的视频编解码算法h.263为例,通过一个具体的视频会议系统,分析传统串行编解码算法的性能,通过英特尔Parallel studio并行化分析工具,找到算法的运行瓶颈,然后用英特尔线程构建模块对编解码算法进行并行化优化,取得了良好的效果。 展开更多
关键词 并行化 英特尔线程构建模块 英特尔并行化分析工具
下载PDF
上一页 1 2 50 下一页 到第
使用帮助 返回顶部