期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
High Performance Motion Estimation Operator Using Multimedia Oriented Subword Parallelism
1
作者 Shafqat Khan Emmanuel Casseau 《通讯和计算机(中英文版)》 2012年第1期1-14,共14页
关键词 多媒体应用 并行处理 计算单位 运动估计 性能 资源利用率 经营单位 SWP
下载PDF
Parallel spatial-temporal mode
2
作者 ZHU Ding-ju 《通讯和计算机(中英文版)》 2009年第4期42-46,共5页
关键词 空间时间模型 平行 数据流水线 计算机技术
下载PDF
SIMD自动向量化编译优化概述 被引量:30
3
作者 高伟 赵荣彩 +2 位作者 韩林 庞建民 丁锐 《软件学报》 EI CSCD 北大核心 2015年第6期1265-1284,共20页
SIMD扩展部件是集成到通用处理器中的加速部件,旨在发掘多媒体程序和科学计算程序的数据级并行.首先介绍SIMD扩展部件的背景和研究现状,然后从发掘方法、数据布局、多平台向量化这3个角度介绍了SIMD自动向量化的研究问题、困难和最新研... SIMD扩展部件是集成到通用处理器中的加速部件,旨在发掘多媒体程序和科学计算程序的数据级并行.首先介绍SIMD扩展部件的背景和研究现状,然后从发掘方法、数据布局、多平台向量化这3个角度介绍了SIMD自动向量化的研究问题、困难和最新研究成果,最后展望了SIMD编译优化未来的研究方向. 展开更多
关键词 SIMD扩展部件 自动向量化 数据级并行 编译优化
下载PDF
基于数据级任务分解的配电网分布式并行计算平台 被引量:14
4
作者 黄伟 庞琳 +1 位作者 曹彬 焦润海 《电网技术》 EI CSCD 北大核心 2014年第4期1103-1108,共6页
为实现大规模配电网的实时分析计算,构建了基于数据级任务分解的配电网分布式并行计算平台。结合配电网运行结构和设备配置,以配电网馈线作为分析单元,采用数据级并行计算方式对配电网计算任务进行分解。配置管理模块、实例、执行端和... 为实现大规模配电网的实时分析计算,构建了基于数据级任务分解的配电网分布式并行计算平台。结合配电网运行结构和设备配置,以配电网馈线作为分析单元,采用数据级并行计算方式对配电网计算任务进行分解。配置管理模块、实例、执行端和客户端4个子系统,分别实现任务生成、任务分解、任务派发以及子任务计算等功能,形成分布式并行计算平台框架。引入消息中间件ZeroMQ技术,采用不同类型套接字的组合实现分布式系统内部的N-N高效通信及与外部系统的数据交互。为验证该平台的实用性及并行计算性能,在平台上实现了山东省某市的城市配电网全局状态估计的分布式并行计算。算例分析表明:在配电网节点达到一定规模时,采用该平台进行分布式并行计算具有明显的速度优势。 展开更多
关键词 数据级并行 分布式并行计算平台 配电网 分布式通信架构
下载PDF
萤火虫2:一种多态并行机的硬件体系结构 被引量:16
5
作者 李涛 杨婷 +5 位作者 易学渊 蒲林 钱博文 黄光新 黄虎才 韩俊刚 《计算机工程与科学》 CSCD 北大核心 2014年第2期191-200,共10页
提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机... 提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机能够实现效率很高的线程级并行运算、数据级并行运算和分布式指令级并行运算。尤其值得指出的是,此种阵列机的流处理性能堪与专用集成电路匹敌。该结构还能有效实现静态与动态数据流计算,可以高效实现图形、图像和数字信号处理任务。 展开更多
关键词 阵列机 多态处理器 计算机图形 图像处理 信号处理 数据级并行 线程级并行
下载PDF
DSP体系结构发展的新趋势 被引量:4
6
作者 黄 峰 李胜平 +2 位作者 朱全庆 熊召新 邹雪城 《计算机工程》 CAS CSCD 北大核心 2002年第4期1-2,218,共3页
CISC→RISC设计思想对DSP体系结构设计中数据和指令级并行性开发产生了深刻影响,融合RISC和SIMD技术的单核处理器已经成为DSP体系结构设计的新趋势。
关键词 超长指令字 单指令多数据流 数据级并行性 指令级并行性 DSP 数字信号处理器 体系结构 单核处理器
下载PDF
多态并行处理器中的SIMD控制器设计与实现 被引量:4
7
作者 蒲林 李涛 +1 位作者 易学渊 韩俊刚 《电子技术应用》 北大核心 2013年第11期53-55,59,共4页
设计和实现了一种多态并行处理器中的SIMD控制器。为满足图像并行处理的需要,以实现高效的数据级并行计算为目标,采用状态机实现了行、列、簇控制器的设计,完成了SIMD指令的发送、数据的加载和远程数据的传输。在阵列机上分区并发实现了... 设计和实现了一种多态并行处理器中的SIMD控制器。为满足图像并行处理的需要,以实现高效的数据级并行计算为目标,采用状态机实现了行、列、簇控制器的设计,完成了SIMD指令的发送、数据的加载和远程数据的传输。在阵列机上分区并发实现了SIMD和MIMD两种计算模式,能够实现两种计算模式的切换。专用的硬件电路设计提高了该处理器处理并行数据的能力。 展开更多
关键词 多态并行处理器 SIMD控制器 数据级并行 阵列机
下载PDF
多态并行机上的3D图形渲染 被引量:7
8
作者 韩俊刚 姚静 +4 位作者 李涛 黄虎才 乔虹 延酉玫 王鹏博 《西安邮电大学学报》 2015年第2期1-6,15,共7页
针对多态同构阵列处理器,提出一种图形算法并行化的实现方法。该方法通过分析图形流水线中渲染算法的控制依赖、数据依赖关系,并对各个算法计算量进行估计,利用多态阵列处理机的能够结合不同类型的并行计算的特点,以处理器的负载均衡为... 针对多态同构阵列处理器,提出一种图形算法并行化的实现方法。该方法通过分析图形流水线中渲染算法的控制依赖、数据依赖关系,并对各个算法计算量进行估计,利用多态阵列处理机的能够结合不同类型的并行计算的特点,以处理器的负载均衡为依据,实现图形渲染的并行化计算。实验结果表明,该方法所实现的加速比按线性增长。 展开更多
关键词 多态阵列机 并行计算 图形渲染 线程并行 操作并行 数据并行
下载PDF
并行编译中一种线性数据和计算划分算法 被引量:5
9
作者 董春丽 韩林 赵荣彩 《计算机工程》 EI CAS CSCD 北大核心 2006年第24期26-28,共3页
对于高性能并行计算机而言,如何找到一种好的计算和数据划分,对数据和计算进行合理划分,增加数据本地化来减少处理器间的通信是提高其并行性能的关键。该文讨论了一种线性的自动进行无数据重组的计算和数据划分算法。
关键词 并行编译 数据划分 计算划分 循环级并行
下载PDF
基于Spark的大数据热图可视化方法 被引量:11
10
作者 张繁 袁兆康 +2 位作者 肖凡平 尤堃 王章野 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2016年第11期1881-1886,共6页
针对普通客户端浏览和分析大数据困难的问题,结合Spark和LOD技术,以热图为例提出一种面向大数据可视化技术框架.首先利用Spark平台分层并以瓦片为单位并行计算,然后将结果分布式存储在HDFS上,最后通过web服务器应用Ajax技术结合地理信... 针对普通客户端浏览和分析大数据困难的问题,结合Spark和LOD技术,以热图为例提出一种面向大数据可视化技术框架.首先利用Spark平台分层并以瓦片为单位并行计算,然后将结果分布式存储在HDFS上,最后通过web服务器应用Ajax技术结合地理信息提供各种时空分析服务.文中重点解决了数据点位置和地图之间的映射,以及由于并行计算导致的热图瓦片之间边缘偏差这2个问题.实验结果表明,该方法将数据交互操作与数据绘制和计算任务分离,为浏览器端大数据可视化提供了一个新的思路. 展开更多
关键词 热图 并行计算 大数据 细节层次
下载PDF
流水安全法─—一个面向软件流水技术的新的数据相关性分析方法 被引量:2
11
作者 汤志忠 张赤红 乔林 《计算机学报》 EI CSCD 北大核心 1998年第S1期201-206,共6页
软件流水是一种很有效的指令级并行优化技术,而能否进行尽可能精确的数据相关性分析是决定软件流水优化效果的一个非常重要的因素.本文通过分析软件流水技术本身的特点,从保障软件流水安全为出发点,导出了一组更严洛有效的相关方程... 软件流水是一种很有效的指令级并行优化技术,而能否进行尽可能精确的数据相关性分析是决定软件流水优化效果的一个非常重要的因素.本文通过分析软件流水技术本身的特点,从保障软件流水安全为出发点,导出了一组更严洛有效的相关方程和限制不等式,大大提高了相关性判别的能力,最后与现有工作进行了比较,并用一个例子加以验证. 展开更多
关键词 数据相关性分析 指令级并行 软件流水 并行优化编译
下载PDF
基于多层循环并行化的负载平衡优化 被引量:1
12
作者 郭克榕 唐新春 《国防科技大学学报》 EI CAS CSCD 1997年第5期40-45,共6页
负载平衡是并行处理中的一个重要概念。参与一个程序执行的各处理机所承担的工作量是否均衡直接影响该程序的并行性能。本文对面向MPP系统程序循环级并行化中负载平衡的优化进行了探讨,提出了优化策略及其实施算法。
关键词 程序并行化 负载平衡 数据分布 并行处理 优化
下载PDF
简单高性能微处理器的设计 被引量:5
13
作者 朱怡健 吴强 杨全胜 《电气电子教学学报》 2004年第2期67-70,共4页
提高指令级并行度是处理器体系结构发展的重要方向 ,也是当前计算机组织、计算机结构课程的重要内容之一。为使学生对指令流水线、超标量等技术有更深入的理解和体会 ,本文介绍了一个简单的具有超标量流水线结构的微处理器模型的设计思... 提高指令级并行度是处理器体系结构发展的重要方向 ,也是当前计算机组织、计算机结构课程的重要内容之一。为使学生对指令流水线、超标量等技术有更深入的理解和体会 ,本文介绍了一个简单的具有超标量流水线结构的微处理器模型的设计思想。针对在指令并行执行过程中出现的数据相关冲突 ,提出了指令相关性检查算法和数据相关性检查算法。论述了如何利用 VHDL语言的特点 ,准确描述硬件的并行性及系统模块的划分 。 展开更多
关键词 微处理器 指令级并行度 体系结构 超标量流水线 数据相关冲突
下载PDF
流化H.264编码的数据并行方法
14
作者 文梅 任巨 +3 位作者 伍楠 苏华友 荀长庆 张春元 《国防科技大学学报》 EI CAS CSCD 北大核心 2011年第3期66-71,共6页
流模型是一种源于媒体处理的新型并行计算模型。然而H.264编码作为媒体处理领域中的重要应用,在与流模型适配时,却出现重要障碍,主要是由于相关性问题极大地限制了流化过程中数据级并行的开发。针对这个问题,首先根据编码算法分析了编... 流模型是一种源于媒体处理的新型并行计算模型。然而H.264编码作为媒体处理领域中的重要应用,在与流模型适配时,却出现重要障碍,主要是由于相关性问题极大地限制了流化过程中数据级并行的开发。针对这个问题,首先根据编码算法分析了编码过程中遇到的相关性问题,然后为各主要编码模块分别提出解除相关性限制的数据并行编码方法。采用这些方法能够保证大数据并行粒度,最终达到高效并行流化编码的目的。实验表明采用数据并行流化编码方法,帧间预测、帧内预测、熵编码和去块滤波模块都获得了显著加速。 展开更多
关键词 H.264编码 流模型 并行计算 数据并行
下载PDF
可逆处理器指令流水线的设计与仿真 被引量:1
15
作者 朱鹏程 管致锦 卫丽华 《计算机工程与设计》 北大核心 2016年第10期2654-2660,共7页
为实现可逆处理器的指令流水线,提出一种适合可逆指令流水的数据通路图。明确可逆指令流水线的7个阶段(即读指令、指令译码、读寄存器、运算/访问存储器、写寄存器、指令编码、返回指令)以及各阶段任务,分析在可逆约束下指令流水可能遇... 为实现可逆处理器的指令流水线,提出一种适合可逆指令流水的数据通路图。明确可逆指令流水线的7个阶段(即读指令、指令译码、读寄存器、运算/访问存储器、写寄存器、指令编码、返回指令)以及各阶段任务,分析在可逆约束下指令流水可能遇到的数据冒险和控制冒险,通过转发和阻塞技术解决此类冒险。通过仿真系统验证该指令流水线的正确性,仿真结果表明,该方法能有效实现可逆处理器中的指令级并发,在保证程序功能不变的前提下交换一些指令的位置,显著提高流水线性能。 展开更多
关键词 可逆处理器 流水线 数据冒险 控制冒险 指令级并发
下载PDF
面向SLP的多重循环向量化 被引量:13
16
作者 魏帅 赵荣彩 姚远 《软件学报》 EI CSCD 北大核心 2012年第7期1717-1728,共12页
如今,越来越多的处理器集成了SIMD(single instruction multiple data)扩展,现有的编译器大多也实现了自动向量化的功能,但是一般都只针对最内层循环进行向量化,对于多重循环缺少一种通用、易行的向量化方法.为此,提出了一种面向SLP(sup... 如今,越来越多的处理器集成了SIMD(single instruction multiple data)扩展,现有的编译器大多也实现了自动向量化的功能,但是一般都只针对最内层循环进行向量化,对于多重循环缺少一种通用、易行的向量化方法.为此,提出了一种面向SLP(superword level parallelism)的多重循环向量化方法,从外至内依次对各个循环层次进行分析,收集各层循环对应的一些影响向量化效果的属性值,主要包括能否对该循环进行直接循环展开和压紧、有多少数组引用相对于该循环索引连续以及该循环所包含的区域等,然后根据这些属性值决定在哪些循环层次进行直接循环展开和压紧,最后通过SLP对循环中的语句进行向量化.实验结果表明,该算法相对于内层循环向量化和简单的外层循环向量化平均加速比提升了2.13和1.41,对于一些常用的核心循环可以得到高达5.3的加速比. 展开更多
关键词 SIMD 向量化 依赖关系分析 多重循环 超字并行
下载PDF
支持数据重分布通信的计算和数据分解算法
17
作者 董春丽 赵荣彩 +1 位作者 韩林 张亚 《计算机工程》 CAS CSCD 北大核心 2007年第10期41-43,共3页
对于分布内存体系结构的并行计算机而言,如何对计算和数据进行合理划分以增加数据本地化减少处理器间的通信是提高其并行性能的关键,但在数据划分过程中,重分布通信有时不可避免,如何进行合理的数据和计算划分以减少通信并最大限度的利... 对于分布内存体系结构的并行计算机而言,如何对计算和数据进行合理划分以增加数据本地化减少处理器间的通信是提高其并行性能的关键,但在数据划分过程中,重分布通信有时不可避免,如何进行合理的数据和计算划分以减少通信并最大限度的利用程序的并行性是并行编译中的一个重要问题。该文主要讨论了一种支持数据重分布的自动进行计算和数据划分的算法。 展开更多
关键词 并行编译 数据分解 计算划分 数据重分布 循环级并行
下载PDF
多核系统上任意2序列公共元素的并行查找
18
作者 蔡德霞 钟诚 +1 位作者 韦兴柳 林孔升 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第2期172-175,246,共5页
文章依据多核系统共享二级缓存和私有一级缓存的容量,采用数据多级分块技术、数据局部性原理和循环并行优化方法,设计了多核系统上存储高效、线程级并行、扩展性好的任意2序列公共元素的并行查找算法。结果表明,该文所给算法充分发挥了... 文章依据多核系统共享二级缓存和私有一级缓存的容量,采用数据多级分块技术、数据局部性原理和循环并行优化方法,设计了多核系统上存储高效、线程级并行、扩展性好的任意2序列公共元素的并行查找算法。结果表明,该文所给算法充分发挥了多核系统的软硬件特性,获得了良好的加速比和可扩展性。 展开更多
关键词 数据序列 公共元素 并行查找 多核计算 多级数据分块 数据局部性 循环并行优化
下载PDF
并行编程环境PPCDS的设计与实现
19
作者 黄宇光 郑全录 丁鹤然 《计算机工程》 CAS CSCD 北大核心 2001年第12期28-29,83,共3页
介绍了并行程序概念设计系统PPCDS(Parallel Program Conceptually Designing System)的设计和实现方法。该系统支持并行程序概念设计方法,可以有效地减少并行编程的复杂性,提高并行程序的开发效率。
关键词 并行编程环境 PPCDS 并行程序概念设计系统 计算机
下载PDF
一个VLIW体系结构的单片多处理机
20
作者 汤志忠 张赤红 《计算机研究与发展》 EI CSCD 北大核心 1993年第10期1-8,共8页
本文介绍一个采用VLIW 超长指令字体系结构的高性能单片多处理机,在这个体系结构中采用流水寄存器堆来消除循环程序内的数据相关,从而使程序能够在指令级以极高的并行度并行运行。模拟实验结果表明这个体系结构具有很高的运算速度和很... 本文介绍一个采用VLIW 超长指令字体系结构的高性能单片多处理机,在这个体系结构中采用流水寄存器堆来消除循环程序内的数据相关,从而使程序能够在指令级以极高的并行度并行运行。模拟实验结果表明这个体系结构具有很高的运算速度和很好的性能价格比。 展开更多
关键词 VLIW 体系结构 单片多处理机
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部