期刊文献+
共找到1,176篇文章
< 1 2 59 >
每页显示 20 50 100
一种改进的全变分降噪算法在低剂量工业CT重建图像中的应用
1
作者 葛春平 何冰 +1 位作者 袁卫 林关成 《渭南师范学院学报》 2024年第5期83-87,共5页
针对低剂量CT重建中的噪声抑制问题,文章将全变分降噪模型应用到CT重建的图像投影域,并介绍了ROF模型及能量泛函的建立,以及在低剂量CT图像处理中的应用。提出一种改进的ROF模型的实现方法。首先,利用梯度下降算法对投影图进行迭低降噪... 针对低剂量CT重建中的噪声抑制问题,文章将全变分降噪模型应用到CT重建的图像投影域,并介绍了ROF模型及能量泛函的建立,以及在低剂量CT图像处理中的应用。提出一种改进的ROF模型的实现方法。首先,利用梯度下降算法对投影图进行迭低降噪处理。其次,使用滤波反投影算法对工业CT图像进行重建。最后,通过CUDA并行运算实现了整个改进算法的过程,提高了算法的运行时间。通过模拟噪声和锂电池快速在线工业CT设备图像处理结果证明:所提出的方法能有效降低重建图像的噪声,提高图像峰值信噪比。 展开更多
关键词 全变分 低剂量 CT重建
下载PDF
高性能并行计算的发展历程
2
作者 陈国良 《计算机科学》 CSCD 北大核心 2024年第1期1-3,共3页
并行计算是相对于串行计算而言的,它是将一个计算任务分解成若干相对独立的子任务,然后用若干个处理器对其并行求解。使用并行计算最直接的目的就是提高问题的求解速度以快速完成原问题的解。非数值计算是相对数值计算而言的,它研究的... 并行计算是相对于串行计算而言的,它是将一个计算任务分解成若干相对独立的子任务,然后用若干个处理器对其并行求解。使用并行计算最直接的目的就是提高问题的求解速度以快速完成原问题的解。非数值计算是相对数值计算而言的,它研究的是如何将计算科学中一些不能直接使用数学函数解决的问题并行求解。90年代开始,我带领团队系统地开展了此方面的研究,首先是奠定了所需的理论基础,并逐渐形成了完善的学科体系和应用示范。在此过程中,我们还积极倡导交叉学科研究,及时关注学科前沿技术,并且坚持学术研究要服务于国民经济主战场。在整个研究过程中,我们一方面积极开展国际学术交流,创办国际学术会议和专业期刊;另一方面坚持自力更生,研制自主可控的国产高性能计算机,创建科教平台为普及中国高性能计算机教育服务。 展开更多
关键词 并行计算 高性能计算 国产计算机 学科体系
下载PDF
基于大数据的性能评测BSP模型构建
3
作者 袁伟 孙永强 +1 位作者 周舶 肖斌 《数字技术与应用》 2024年第5期220-222,共3页
BSP(Bulk Synchronous Parallel)模型也被称为“块同步并行模型”或“整体同步并行计算模型”。该模型由哈佛大学的Leslie Valiant提出,旨在简化并行计算的复杂性和提高可编程性。BSP模型为复杂并行计算提供了一个简化的编程框架,这一... BSP(Bulk Synchronous Parallel)模型也被称为“块同步并行模型”或“整体同步并行计算模型”。该模型由哈佛大学的Leslie Valiant提出,旨在简化并行计算的复杂性和提高可编程性。BSP模型为复杂并行计算提供了一个简化的编程框架,这一模型不仅让编程变得更为简单,还显著地增强了程序的稳定性和性能的可预测性,对于现今高度复杂的计算需求提供了极大的帮助。尤其在智能控制和复杂网络科学计算中,BSP模型的应用日益显现其重要性。软件业从编程为主转变为以数据为主。大数据处理的兴起改变了云计算的发展方向,云计算正在进入以“分析即服务”为主要标志的Cloud 2.0时代,网构软件和安全生产是应用方向。结构化软件设计技术思想的大数据研究是研究运用3P原理,强调全面、系统、快速解决问题。 展开更多
关键词 BSP模型 软件设计技术 大数据处理 云计算 并行计算 智能控制 网构软件 可预测性
下载PDF
Reduce函数的不可交换性检测
4
作者 朱晨璐 王熙 +1 位作者 常博博 杨振 《电脑编程技巧与维护》 2024年第1期37-39,共3页
MapReduce是一种流行的编程模型,通过分而治之的思想很好地解决了许多并行计算问题。然而,在其广泛应用的背后还存在着非常严峻的考验。MapReduce程序可能因为输入数据到达Reduce函数的顺序不同而产生不确定的输出结果。为了使MapReduc... MapReduce是一种流行的编程模型,通过分而治之的思想很好地解决了许多并行计算问题。然而,在其广泛应用的背后还存在着非常严峻的考验。MapReduce程序可能因为输入数据到达Reduce函数的顺序不同而产生不确定的输出结果。为了使MapReduce程序的输出更加可靠,需要对Reduce函数的不可交换性进行检测。针对上述问题,提出了一种Reduce函数的不可交换性检测方法。首先,通过简化循环的符号执行方法及程序分析方法,生成具有针对性的原始测试用例;其次,通过一种能够快速改变记录行间相对位置的置换函数Ex生成后继测试用例;最后,通过比较原始测试用例及后继测试用例的执行结果是否相同,来检测Reduce函数的不可交换性。实验结果表明,该方法扩大了可以测试的Reduce函数种类,将测试用例集的大小从阶乘级别缩小到线性级别,降低了检测Reduce函数不可交换性的复杂度和难度。 展开更多
关键词 MAPREDUCE模型 Reduce函数 不可交换性 并行计算 符号执行
下载PDF
面向深度学习图像分类的GPU并行方法研究 被引量:1
5
作者 韩彦岭 沈思扬 +3 位作者 徐利军 王静 张云 周汝雁 《计算机工程》 CAS CSCD 北大核心 2023年第1期191-200,共10页
针对深度学习图像分类场景中多GPU并行后传输效率低的问题,提出一种低时间复杂度的Ring All Reduce改进算法。通过分节点间隔配对原则优化数据传输流程,缓解传统参数服务器并行结构的带宽损耗。基于数据并行难以支撑大规模网络参数及加... 针对深度学习图像分类场景中多GPU并行后传输效率低的问题,提出一种低时间复杂度的Ring All Reduce改进算法。通过分节点间隔配对原则优化数据传输流程,缓解传统参数服务器并行结构的带宽损耗。基于数据并行难以支撑大规模网络参数及加速延缓的问题,根据深度学习主干网络所包含的权重参数低于全连接层权重参数、同步开销小、全连接层权重大与梯度传输开销过高等特点,提出GPU混合并行优化算法,将主干网络进行数据并行,全连接层进行模型并行,并通过改进的Ring All Reduce算法实现各节点之间的并行后数据通信,用于基于深度学习模型的图像分类。在Cifar10和mini ImageNet两个公共数据集上的实验结果表明,该算法在保持分类精度不变的情况下可以获得更好的加速效果,相比数据并行方法,可达到近45%的提升效果。 展开更多
关键词 GPU并行 Ring All Reduce算法 数据并行 模型并行 深度学习 图像分类
下载PDF
FDTD算法的网络并行运算实现 被引量:29
6
作者 薛正辉 杨仕明 +1 位作者 高本庆 张泽杰 《电子学报》 EI CAS CSCD 北大核心 2003年第12期1839-1843,共5页
本文提出了FDTD方法在微机互连构成的机群 (COW)并行计算系统上以消息传递方式执行的一种实现方案 .组成了验证性的机群并行计算系统 ,以一维和三维典型算例验证了算法的可行性、正确性和高效性 ,为运用FDTD方法进行电大尺寸复杂电磁问... 本文提出了FDTD方法在微机互连构成的机群 (COW)并行计算系统上以消息传递方式执行的一种实现方案 .组成了验证性的机群并行计算系统 ,以一维和三维典型算例验证了算法的可行性、正确性和高效性 ,为运用FDTD方法进行电大尺寸复杂电磁问题数值模拟计算提供了一条有效的途径 。 展开更多
关键词 时域有限差分法 机群系统 并行虚拟机 并行计算 FDTD
下载PDF
二分K均值聚类算法优化及并行化研究 被引量:23
7
作者 张军伟 王念滨 +1 位作者 黄少滨 蔄世明 《计算机工程》 CAS CSCD 北大核心 2011年第17期23-25,共3页
二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均... 二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均匀划分的策略,对算法进行并行化处理。实验结果表明,改进后的算法能获得比较理想的加速比和较高的使用效率。 展开更多
关键词 数据挖掘 聚类算法 二分K均值 并行化 群集系统
下载PDF
高性能并行集群计算环境的构建与性能测试 被引量:20
8
作者 王小伟 郭力 +1 位作者 葛蔚 杨章远 《小型微型计算机系统》 CSCD 北大核心 2004年第3期325-328,共4页
高性能并行集群系统在大规模科学计算中发挥着越来越重要的作用 .本文介绍了一个集群系统的硬件和软件环境的设置 。
关键词 并行计算 并行集群系统 性能测试 硬件环境 软件环境
下载PDF
基于切比雪夫距离的支撑点选择算法的并行优化研究
9
作者 陶顺安 李强 +2 位作者 尚小敏 周全 张璁 《青岛大学学报(自然科学版)》 CAS 2023年第4期41-45,53,共6页
求解切比雪夫距离的支撑点选择算法中,由于计算量较大,如何快速判断支撑点的优劣是一个难以解决的问题,为此,提出一套以切比雪夫距离为目标函数的快速支撑点优选策略。通过并行化分析找出相对独立的计算任务,使用OpenMP对支撑点的选择... 求解切比雪夫距离的支撑点选择算法中,由于计算量较大,如何快速判断支撑点的优劣是一个难以解决的问题,为此,提出一套以切比雪夫距离为目标函数的快速支撑点优选策略。通过并行化分析找出相对独立的计算任务,使用OpenMP对支撑点的选择并行化处理;为降低算法层面的时间复杂度,将切比雪夫距离转化为曼哈顿距离,减少了总体计算量;采用多线程的方法对目标函数值的排序环节进行总体重构,避免了无意义的访存开销。实验结果表明,相比传统方法,支撑点优选算法具有较为明显的加速效果,加速比达到了174.62,并解决了算法的数据依赖问题。 展开更多
关键词 切比雪夫距离 支撑点选择 并行计算
下载PDF
基于Linux的Beowulf集群的实现 被引量:17
10
作者 李贵明 俞国扬 罗家融 《计算机工程》 CAS CSCD 北大核心 2003年第11期49-51,共3页
中国科学院等离子体物理研究所是国内从事核聚变研究和托卡马克(Tokamak)实 验的主要基地,由于实验研究的需要,有必要建立自己的大型并行计算机系统,进行托卡马 克实验的数值模拟等研究课题?文章介绍了在普通PC机上利用Linux操作系统实... 中国科学院等离子体物理研究所是国内从事核聚变研究和托卡马克(Tokamak)实 验的主要基地,由于实验研究的需要,有必要建立自己的大型并行计算机系统,进行托卡马 克实验的数值模拟等研究课题?文章介绍了在普通PC机上利用Linux操作系统实现基于分布 存储结构的Beowulf集群系统的方法,同时也介绍了基于消息传递模型 (Message Passing I nterface,MPI)的并行程序设计方法? 展开更多
关键词 并行计算 TOKAMAK BEOWULF Linux 分布存储 消息传递接口
下载PDF
SIMD技术与向量数学库研究 被引量:10
11
作者 解庆春 张云泉 +2 位作者 王可 李焱 许亚武 《计算机科学》 CSCD 北大核心 2011年第7期298-301,共4页
首先,结合Intel,AMD和IBM处理器,介绍了单指令流多数据流(SIMD)向量化技术及其各自的特点。其次,在3种平台上对各自开发的函数库中的部分向量数学函数进行了测试。结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Cell ... 首先,结合Intel,AMD和IBM处理器,介绍了单指令流多数据流(SIMD)向量化技术及其各自的特点。其次,在3种平台上对各自开发的函数库中的部分向量数学函数进行了测试。结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Cell SDK函数,因其独特的体系结构,多个向量处理单元带来的平均加速比为10。最后,通过测试结果的对比,发现不同数学库中的向量函数之间在性能方面也存在着差异,并对差异原因进行了分析,得出性能差异主要是处理器架构和向量计算单元个数和访存等因素造成的。 展开更多
关键词 向量化 SSE MMX 3DNow! SIMD
下载PDF
基于极大安全通路向量的超立方体容错路由 被引量:11
12
作者 王雷 林亚平 +1 位作者 陈治平 文学 《通信学报》 EI CSCD 北大核心 2004年第4期130-137,共8页
针对超立方体结构的多处理机系统中存在链路故障的情况,提出了用于最优通路记录的极大安全通路向量的概念,给出了一个建立MSPV及其容错路由算法。证明了MSPV通过n-1轮邻节点之间的信息交换,能以向量的形式记录最多的最优通路;与基于安... 针对超立方体结构的多处理机系统中存在链路故障的情况,提出了用于最优通路记录的极大安全通路向量的概念,给出了一个建立MSPV及其容错路由算法。证明了MSPV通过n-1轮邻节点之间的信息交换,能以向量的形式记录最多的最优通路;与基于安全向量及扩展安全向量的容错路由算法相比,MSPV是SV以及ESV的最大扩展,解决了如何用向量的形式来记录最多最优通路的问题. 展开更多
关键词 计算机应用技术 容错路由 极大安全通路向量 超立方体
下载PDF
基于Hadoop平台的改进关联规则挖掘算法 被引量:15
13
作者 王英博 马菁 +1 位作者 柴佳佳 赵彬 《计算机工程》 CAS CSCD 北大核心 2016年第10期69-74,79,共7页
数据采集方式的增多导致单处理器下的关联规则挖掘受到I/O和内存的限制。针对该问题,对传统挖掘算法进行改进。借助Hadoop平台的优势,通过累加迭代的方法降低算法的时间复杂度,并利用MapReduce编程特点,通过一次遍历和MapReduce任务调... 数据采集方式的增多导致单处理器下的关联规则挖掘受到I/O和内存的限制。针对该问题,对传统挖掘算法进行改进。借助Hadoop平台的优势,通过累加迭代的方法降低算法的时间复杂度,并利用MapReduce编程特点,通过一次遍历和MapReduce任务调度完成频繁项集挖掘,在强关联挖掘中通过Sqoop组件将外部表Hive中的数据迁移到Redis,实现数据的高速读取。实验结果表明,该方法可有效提高挖掘效率,提高幅度随数据集规模同步增大,并且具有较好的加速比和扩展性。 展开更多
关键词 HADOOP平台 MapReduce编程 关联规则 大数据 数据挖掘
下载PDF
一种基于预测的动态负载均衡模型及算法研究 被引量:9
14
作者 陈志刚 许伟 曾志文 《计算机工程》 CAS CSCD 北大核心 2004年第23期87-89,共3页
提出了一种基于负载预测的动态负载均衡方法,它改变了一般动态负载均衡方法中负载信息采集过时的情况,有效解决了负载迁移的抖动问题,提高了平衡系统的性能。给出了该方法的实现模型、算法,并进行了性能分析,最后给出了实验结果。
关键词 动态负载均衡 负载迁移 负载信息 负载预测 实现模型 算法研究 平衡系统 抖动 性能分析 有效解
下载PDF
基于Fluent的绕流问题的数值模拟与并行计算 被引量:15
15
作者 辛晓华 张武 周华 《计算机工程与设计》 CSCD 北大核心 2005年第8期2153-2154,2200,共3页
使用商用软件Fluent对二维不可压流问题进行了两次实验,两次实验的网格数相差很多,发现当网格数少的时候,并行计算反而不如单机的效果好;而当网格数足够大的时候,并行计算就显示出其优越性来,目的在于考察Fluent软件的并行计算能力,为... 使用商用软件Fluent对二维不可压流问题进行了两次实验,两次实验的网格数相差很多,发现当网格数少的时候,并行计算反而不如单机的效果好;而当网格数足够大的时候,并行计算就显示出其优越性来,目的在于考察Fluent软件的并行计算能力,为进行大规模工程应用计算提供技术参照。 展开更多
关键词 FLUENT PARALLEL FLUENT 绕流 数值模拟 并行计算
下载PDF
用PC机群组构并行超级计算机 被引量:17
16
作者 黎康保 陶文正 +1 位作者 许丽华 黎文楼 《计算机工程》 CAS CSCD 北大核心 2000年第9期1-3,共3页
美国由高等院校、大型实验室和研究部门共同研究推出PC群机Beowulf超级计算机.这一创举,说明超级计算机可以用大众化的PC机集群来完成,这对我国是一个挑战和机遇.这里对Beowulf作了一些研究的基础上,论述了PC... 美国由高等院校、大型实验室和研究部门共同研究推出PC群机Beowulf超级计算机.这一创举,说明超级计算机可以用大众化的PC机集群来完成,这对我国是一个挑战和机遇.这里对Beowulf作了一些研究的基础上,论述了PC群机的结构组成原理,操作系统平台和并行计算秩序设计、并行通信程序设计等问题. 展开更多
关键词 并行计算机群机 PC集群技术 LINUX应用 MPI应用
下载PDF
HPMR:多核集群上的高性能计算支撑平台 被引量:11
17
作者 郑启龙 王昊 +1 位作者 吴晓伟 房明 《微电子学与计算机》 CSCD 北大核心 2008年第9期21-23,27,共4页
HPMR是建立在多核集群上的高性能计算支撑平台,它继承并改进了MapRedcue并行编程模式,使其适合高性能计算需求.HPMR让并行程序的编写和运行变得非常简单,同时又保持很高的性能.HPMR的实用功能不但使并行程序变得易于扩展和移植,而且增... HPMR是建立在多核集群上的高性能计算支撑平台,它继承并改进了MapRedcue并行编程模式,使其适合高性能计算需求.HPMR让并行程序的编写和运行变得非常简单,同时又保持很高的性能.HPMR的实用功能不但使并行程序变得易于扩展和移植,而且增强了并行程序的健壮性. 展开更多
关键词 高性能计算 多核 平台 MAPREDUCE
下载PDF
基于空间聚类的矢量空间数据并行计算划分方法 被引量:7
18
作者 邱强 方雷 +1 位作者 姚晓 方金云 《高技术通讯》 CAS CSCD 北大核心 2015年第4期327-333,共7页
为了解决并行矢量空间分析在数据划分阶段的负载均衡问题,研究了矢量空间数据的划分,提出了一种基于空间聚类思想的矢量空间数据划分方法。该方法充分考虑矢量空间数据规模以及空间邻近性特征对并行空间分析算法效率的影响,首先采用空... 为了解决并行矢量空间分析在数据划分阶段的负载均衡问题,研究了矢量空间数据的划分,提出了一种基于空间聚类思想的矢量空间数据划分方法。该方法充分考虑矢量空间数据规模以及空间邻近性特征对并行空间分析算法效率的影响,首先采用空间填充曲线对二维空间数据进行编码,保证空间要素邻近性特征;然后用空间要素集合对空间要素流进行填充,从而确保各个子任务集中的要素数据规模相对均衡。以并行叠加分析中点面、线面、面面叠加操作为例,设计了对比实验。实验结果表明,该方法能够有效提高以线、面要素为操作对象的并行算法负载均衡度和提高并行算法整体运行效率。 展开更多
关键词 并行计算 HILBERT曲线 矢量数据 负载均衡 要素集合
下载PDF
基于复杂曲线表示的切比雪夫多项式拟合并行算法 被引量:5
19
作者 邓倩妮 陈笠 +1 位作者 陆鑫达 何赢潮 《上海交通大学学报》 EI CAS CSCD 北大核心 2003年第6期906-909,共4页
骨科临床造型系统中进行假体再造时 ,要对 CT片上的原始点采用数学逼近法进行优化处理 .常用的数学逼近法中切比雪夫多项式拟和法误差较小 ,对此 ,提出一种基于复杂曲线表示的切比雪夫多项式拟合并行算法 ,并采用两种 Java方案实现并行... 骨科临床造型系统中进行假体再造时 ,要对 CT片上的原始点采用数学逼近法进行优化处理 .常用的数学逼近法中切比雪夫多项式拟和法误差较小 ,对此 ,提出一种基于复杂曲线表示的切比雪夫多项式拟合并行算法 ,并采用两种 Java方案实现并行程序 .实验结果表明 ,与一般的切比雪夫多项式拟合串行算法相比 ,基于复杂曲线表示的切比雪夫多项式拟合并行算法保持了较高的计算精度 。 展开更多
关键词 并行计算 数据拟合 切比雪夫多项式 多线程 Java远程方法调用
下载PDF
基于MPI+CUDA的异构并行可压缩流求解器 被引量:7
20
作者 刘枫 李桦 +1 位作者 田正雨 潘沙 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第1期6-10,共5页
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数... 在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求解器鲁棒性好,计算效率较CPU同构并行计算提高10倍以上。 展开更多
关键词 消息传递接口 统一计算设备架构 异构计算 可压缩流
下载PDF
上一页 1 2 59 下一页 到第
使用帮助 返回顶部