期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
高并行性能Intel Core i7多核处理器及其关键技术研究
1
作者 王文义 王杰 《中原工学院学报》 CAS 2011年第5期23-26,共4页
介绍了Intel Nehalem多核处理器微架构的组成及其独特的三级缓存模式,同时针对并行计算机对处理器在计算性能(Gflops)和能耗比(Mflop/W)两方面的特殊要求,介绍了Nehalem Core i7处理器所采用的一些关键技术,如超线程,QPI总线,内核加速... 介绍了Intel Nehalem多核处理器微架构的组成及其独特的三级缓存模式,同时针对并行计算机对处理器在计算性能(Gflops)和能耗比(Mflop/W)两方面的特殊要求,介绍了Nehalem Core i7处理器所采用的一些关键技术,如超线程,QPI总线,内核加速模式和SSE4.2指令集等,这些技术对高效使用并行计算机是非常必要的. 展开更多
关键词 Nehalem微架构 多核多线程处理器 超线程技术 QPI总线
下载PDF
基于CMP多核集群的混合并行编程技术研究 被引量:1
2
作者 王文义 王春霞 王杰 《计算机科学》 CSCD 北大核心 2014年第2期19-22,共4页
高性能科学计算(High Performance Science Computing,简称HPC)是验证某些理论和测试计算机系统处理能力的一种有效的实验手段。鉴于目前CMP(Chip Multi-processor)多核集群已变得越来越普及,尝试对由MPI和OpenMP两种不同并行编程技术... 高性能科学计算(High Performance Science Computing,简称HPC)是验证某些理论和测试计算机系统处理能力的一种有效的实验手段。鉴于目前CMP(Chip Multi-processor)多核集群已变得越来越普及,尝试对由MPI和OpenMP两种不同并行编程技术构成的混合编程模式做一些实验性的研究。通过对程序执行时间和加速比的实验数据分析,可以看出在多核和多节点集群上采用细粒度的混合并行编程方法较单一使用MPI并行编程方法更加合理和高效,也更能体现出系统硬软件的特性与优势。 展开更多
关键词 高性能计算 CMP多核集群 墙钟时间 MPI+OpenMP混合并行编程
下载PDF
面向混合并行计算系统编程环境的研究与实现 被引量:2
3
作者 武华北 孙济洲 王文义 《计算机科学》 CSCD 北大核心 2010年第4期143-145,178,共4页
分析了基于CMP节点的混合并行计算系统并行处理模式,基于分层次的自顶向下、逐步细化的思想,设计并实现了面向此类混合并行计算系统的编程环境,从而大大降低程了序设计人员在此类环境下编写并行应用程序的复杂度,减少了程序编码错误,提... 分析了基于CMP节点的混合并行计算系统并行处理模式,基于分层次的自顶向下、逐步细化的思想,设计并实现了面向此类混合并行计算系统的编程环境,从而大大降低程了序设计人员在此类环境下编写并行应用程序的复杂度,减少了程序编码错误,提高了编程人员的效率。 展开更多
关键词 多核微处理器 共享缓存 消息传递 混合并行计算系统 并行程序设计
下载PDF
基于并行程序效率和通用性的实践与研究 被引量:3
4
作者 王文义 董绍静 《计算机科学》 CSCD 北大核心 2009年第6期290-293,共4页
大型并行应用软件一般都是成本高昂的,但在实际有效速度和适应硬件环境变化两方面却往往不尽人意。因此,如何设计效率高且不依赖硬件环境的程序,使其能够持续保持价值,就成了人们追求的目标。从HPC中的问题规模、同步等待、消息传递延... 大型并行应用软件一般都是成本高昂的,但在实际有效速度和适应硬件环境变化两方面却往往不尽人意。因此,如何设计效率高且不依赖硬件环境的程序,使其能够持续保持价值,就成了人们追求的目标。从HPC中的问题规模、同步等待、消息传递延迟、数据分解与定位和指令级并行等不同角度出发,通过实例与实验分析,阐述了影响并行应用程序效率和通用性的主要因素,并提出了可用于参考的规则或注意事项。 展开更多
关键词 数据依赖 同步等待 数据分解 Cache利用率 通用性
下载PDF
关于并行程序设计方法的分析与研究 被引量:1
5
作者 王文义 赵建建 王若雨 《郑州大学学报(工学版)》 CAS 北大核心 2009年第2期80-83,共4页
并行程序设计与并行计算机的体系结构密切相关,因此其复杂性要远远大于串行程序设计.介绍了数据分解和循环体依赖等概念,提出了一个cache利用率和并行计算机有效速度的近似关系模型.通过该模型和一个实例,阐述了在并行程序设计中降低和... 并行程序设计与并行计算机的体系结构密切相关,因此其复杂性要远远大于串行程序设计.介绍了数据分解和循环体依赖等概念,提出了一个cache利用率和并行计算机有效速度的近似关系模型.通过该模型和一个实例,阐述了在并行程序设计中降低和拆解计算目标中数据依赖的方法过程,从而达到尽可能多地发掘指令级并行性,提高cache利用率即提高并行系统有效速度的目的. 展开更多
关键词 循环体依赖 Cache利用率 循环展开 指令级并行
下载PDF
关于多核系统并行程序效率的编程因素及其研究
6
作者 王文义 冉晓龙 《计算机科学》 CSCD 北大核心 2015年第8期28-31,59,共5页
着重分析了多核架构系统中内存对齐技术与cache利用率等因素对并行程序性能的影响。用共享存储环境OpenMP分析了并行计算量与处理器核心数目之间的关系,通过用MPI编程实现的矩阵相乘的行划分和CANNON算法等实例分析,指出了只有综合考虑... 着重分析了多核架构系统中内存对齐技术与cache利用率等因素对并行程序性能的影响。用共享存储环境OpenMP分析了并行计算量与处理器核心数目之间的关系,通过用MPI编程实现的矩阵相乘的行划分和CANNON算法等实例分析,指出了只有综合考虑了多核系统的结构特征、系统软件、多核编程语言环境以及正确运用算法等,才能设计出高效且能耗又小的并行应用程序。 展开更多
关键词 绿色计算 内存对齐 OPENMP CANNON算法 多核处理器
下载PDF
高性能科学计算的特征分析及其实用方法研究 被引量:2
7
作者 王文义 王若雨 董绍静 《计算机科学》 CSCD 北大核心 2008年第9期217-219,共3页
任何高性能科学计算(HPC)课题都是一项复杂的系统工程,其具体的应用效率要受到来自硬件和软件等许多因素,主要如并行算法、流水线技术、层次存储器技术和网络互联结构等的制约,诸因素既互相独立又互相关联。本文从一个典型的高性能科学... 任何高性能科学计算(HPC)课题都是一项复杂的系统工程,其具体的应用效率要受到来自硬件和软件等许多因素,主要如并行算法、流水线技术、层次存储器技术和网络互联结构等的制约,诸因素既互相独立又互相关联。本文从一个典型的高性能科学计算——格点量子色动力学研究模型入手,在分析了HPC所涉硬软件存在的一些共性特征的基础上,总结出一些能够改善高性能科学计算应用效率的方法。通过对这些方法长期的应用实践和专门实验,证明它们是有效的。 展开更多
关键词 高性能科学计算 格点量子色动力学 线性模型 费米矩阵 层次存储器技术
下载PDF
基于光栅显示器的反走样图元生成算法研究
8
作者 李晓楠 王文义 王春霞 《郑州大学学报(工学版)》 CAS 北大核心 2010年第5期125-128,共4页
从光栅设备产生图形走样的根本原因出发,在Bresenham算法基础上,提出了一种改进的直线和圆的反走样图元生成算法.算法首先根据与理想曲线相邻的两个像素点到曲线的距离确定其灰度值,使像素灰度值与其到理想曲线的距离成反比,并存储其左... 从光栅设备产生图形走样的根本原因出发,在Bresenham算法基础上,提出了一种改进的直线和圆的反走样图元生成算法.算法首先根据与理想曲线相邻的两个像素点到曲线的距离确定其灰度值,使像素灰度值与其到理想曲线的距离成反比,并存储其左右共三列像素对的灰度值;然后使用高斯滤波掩模对像素点的灰度进行平滑处理,生成反走样图元.该算法已在Visual C++6.0环境下实现,具有较好的显示效果,相对于全屏图像处理具有较低的空间和时间复杂度. 展开更多
关键词 光栅显示 计算机图形学 反走样 高斯滤波
下载PDF
并行系统中时间偏移机制的典型应用算法分析
9
作者 王文义 梁福广 《计算机科学》 CSCD 北大核心 2012年第2期311-313,共3页
像其它许多领域一样,时间偏移机制在并行计算中也得到了充分的应用。实际上,并行计算并不能真正做到让各处理机都完全无时差地实现"并行"运算。由于各任务间存在数据依赖性,使得一些处理机不得不处于间歇等待状态,直至数据到... 像其它许多领域一样,时间偏移机制在并行计算中也得到了充分的应用。实际上,并行计算并不能真正做到让各处理机都完全无时差地实现"并行"运算。由于各任务间存在数据依赖性,使得一些处理机不得不处于间歇等待状态,直至数据到达为止。通过一个典型的并行算法实例对时间偏移机制的作用过程作了详解,直观地描述了实现并行计算的实质,以便为用户在理解并行行为和设计并行程序时提供一些参考。 展开更多
关键词 时间偏移机制 并行计算 Infini Band集群 消息传递接口
下载PDF
一种基于并发命题投影时序逻辑模型检测的入侵检测方法 被引量:1
10
作者 陈建辉 王文义 朱维军 《计算机科学》 CSCD 北大核心 2010年第10期116-117,137,共3页
基于投影时序逻辑模型检测的入侵检测方法具有描述网络入侵者分段攻击的能力,然而对并发攻击仍无能为力,因为该逻辑无法直接描述并发。针对此问题,在该逻辑的基础上定义了一种新的并发算子,并给出基于并发投影时序逻辑模型检测的入侵检... 基于投影时序逻辑模型检测的入侵检测方法具有描述网络入侵者分段攻击的能力,然而对并发攻击仍无能为力,因为该逻辑无法直接描述并发。针对此问题,在该逻辑的基础上定义了一种新的并发算子,并给出基于并发投影时序逻辑模型检测的入侵检测方法。对复杂攻击实例的检测表明,新方法可有效提高对并发攻击的检测能力。 展开更多
关键词 入侵检测 误用检测 模型检测 并发命题投影时序逻辑
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部