期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
一种面向OpenCL架构的矩阵-向量乘并行算法与实现 被引量:2
1
作者 肖汉 周清雷 姚鹏姿 《小型微型计算机系统》 CSCD 北大核心 2019年第1期26-30,共5页
矩阵-向量乘法算法的时间复杂度大,传统计算方法的实时性和跨平台性难以保证.本文提出一种基于开放式计算语言(Open Computing Language,OpenCL)的矩阵-向量乘并行算法,矩阵-向量乘法过程被分解成若干具有不同粒度的子任务.根据相应的... 矩阵-向量乘法算法的时间复杂度大,传统计算方法的实时性和跨平台性难以保证.本文提出一种基于开放式计算语言(Open Computing Language,OpenCL)的矩阵-向量乘并行算法,矩阵-向量乘法过程被分解成若干具有不同粒度的子任务.根据相应的并行度,每个工作组进行矩阵中的行块与列向量的乘积,每个工作项进行行块中行向量与列向量的乘积,并把计算任务分别分配到计算单元和处理单元进行处理.实验结果表明,与基于CPU的串行算法、基于OpenMP并行算法和基于统一计算设备架构(Compute Unified Device Architecture,CUDA)并行算法性能相比,矩阵-向量乘并行算法在OpenCL架构下NVIDIA图形处理器(Graphic Processing Unit,GPU)计算平台上分别获得了20. 86倍、6. 39倍和1. 49倍的加速比.验证了提出的并行优化方法的有效性和性能可移植性. 展开更多
关键词 矩阵-向量乘 图形处理器 开放式计算语言 并行算法
下载PDF
一套二进制向量-矩阵乘法运算的光计算系统 被引量:3
2
作者 张锐 郭威 +1 位作者 李淼 杨建坤 《计算机技术与发展》 2007年第10期141-143,共3页
对计算机前沿领域的光计算进行了讨论研究,介绍了光计算的核心运算器——光学向量-矩阵乘法器的工作原理,从实验角度出发,设计出了一套性能稳定的可实现二进制向量-矩阵乘法运算的光计算系统,并分析了此套系统的光学原理和性能特点。此... 对计算机前沿领域的光计算进行了讨论研究,介绍了光计算的核心运算器——光学向量-矩阵乘法器的工作原理,从实验角度出发,设计出了一套性能稳定的可实现二进制向量-矩阵乘法运算的光计算系统,并分析了此套系统的光学原理和性能特点。此系统具有矩阵乘法运算、数码显示、电压输出等功能,是一套实用性很强的教学科研演示产品,对光学乘法器以及光计算的研究具有一定的指导意义。 展开更多
关键词 计算机 光计算 光学向量-矩阵乘法器
下载PDF
光学向量-矩阵乘法器教学演示实验
3
作者 李修建 杨建坤 +2 位作者 张锐 杨俊才 胡文华 《大学物理》 北大核心 2008年第8期38-41,共4页
为了在光计算教学中提供让学生更易于形象理解光的并行计算能力和实现方式的教学环境,基于向量-矩阵乘法的基本原理,采用LED阵列、光敏管阵列、柱面透镜、薄透镜等简易的基础光学元件搭建了4×4的光学向量-矩阵乘法器教学演示实验.... 为了在光计算教学中提供让学生更易于形象理解光的并行计算能力和实现方式的教学环境,基于向量-矩阵乘法的基本原理,采用LED阵列、光敏管阵列、柱面透镜、薄透镜等简易的基础光学元件搭建了4×4的光学向量-矩阵乘法器教学演示实验.该演示实验展示了并行光计算系统的基本功能实现和构成要素,有助于学生对光计算有初步的形象认识和了解,认知本课程的目的和意义,有利于激发学生对课程学习的兴趣. 展开更多
关键词 并行光计算 光计算硬件 教学演示实验 光学向量-矩阵乘法器
下载PDF
并行稀疏矩阵与向量乘的负载平衡和通信优化 被引量:1
4
作者 付朝江 张武 杨林峰 《水动力学研究与进展(A辑)》 CSCD 北大核心 2004年第z1期937-941,共5页
 本文考虑了在工作站机群上实现大型稀疏矩阵和向量乘的负载平衡。提出了一个快速负载平衡和有效的消息传递技术相结合的方法,来缓解计算和节点间通信。该方法的性能在工作站机群上进行测试,可获得良好结果;并且,通过I/O延迟隐藏和整...  本文考虑了在工作站机群上实现大型稀疏矩阵和向量乘的负载平衡。提出了一个快速负载平衡和有效的消息传递技术相结合的方法,来缓解计算和节点间通信。该方法的性能在工作站机群上进行测试,可获得良好结果;并且,通过I/O延迟隐藏和整体负载平衡使I/O开销能有效地分摊。 展开更多
关键词 稀疏矩阵-向量乘 负载平衡 并行计算 消息传递
下载PDF
基于贪婪分配的稀疏矩阵与向量乘的负载平衡
5
作者 付朝江 《福建工程学院学报》 CAS 2010年第1期79-82,共4页
稀疏矩阵与向量相乘的问题是大规模科学与工程计算的核心部分。考虑在工作站机群上实现大型稀疏矩阵与向量乘的负载平衡,提出了一个快速负载平衡和有效的消息传递技术相结合的方法,来缓解计算和节点间通信。并且通过I/O延迟隐藏和整体... 稀疏矩阵与向量相乘的问题是大规模科学与工程计算的核心部分。考虑在工作站机群上实现大型稀疏矩阵与向量乘的负载平衡,提出了一个快速负载平衡和有效的消息传递技术相结合的方法,来缓解计算和节点间通信。并且通过I/O延迟隐藏和整体负载平衡使I/O开销能有效地分摊。数值测试表明,该方法具有良好的性能。 展开更多
关键词 贪婪分配 稀疏矩阵-向量乘 负载平衡 并行计算
下载PDF
矩阵加权QR分解的一阶扰动界 被引量:1
6
作者 吕鹏 李寒宇 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2016年第4期725-731,共7页
利用经典的矩阵方程方法、修正的矩阵方程方法和矩阵-向量方程方法讨论加权QR分解的扰动分析问题,得到了范数型扰动下的范数型一阶扰动界.
关键词 加权QR分解 范数型扰动 一阶扰动界 矩阵-向量方程方法
下载PDF
基于FPGA的电磁瞬态仿真器研究 被引量:2
7
作者 刘志恒 孟晓凯 +1 位作者 张帆 冉宁 《高电压技术》 EI CAS CSCD 北大核心 2019年第7期2046-2052,共7页
为了提高配电网故障电磁瞬态特性的实时仿真效率,避免复杂的现场可编程门阵列(field-programmable gatearray,FPGA)编程,本文研究了一种基于FPGA的自动实时电磁瞬态仿真器。首先通过综合改进的增广节点分析(modified augmented nodal an... 为了提高配电网故障电磁瞬态特性的实时仿真效率,避免复杂的现场可编程门阵列(field-programmable gatearray,FPGA)编程,本文研究了一种基于FPGA的自动实时电磁瞬态仿真器。首先通过综合改进的增广节点分析(modified augmented nodal analysis, MANA)方法和固定的导纳矩阵节点方法(fixed admittance matrix nodal method,FAMNM)构建了求解器;然后基于开关电导参数的最优选择,建立了高效的稀疏矩阵-向量乘法器;最后通过对三相配电网络中的单相接地故障后电磁瞬态特性进行测试,验证了仿真器的性能。实验结果表明:MANA-FAMNM的特殊结构可以实现极低的积分时间步长,并且避免了仿真器重新设计FPGA代码,该应用程序可直接用于不同的拓扑结构;仿真器能够实时精确地再现配电网故障中发生的电磁瞬态特性以及在传输线中传播的电磁波,FPGA-RTS仿真与软件EMTP-RV离线仿真的C相相电压值的最大误差约为0.006pu,完全满足工程应用的要求。该仿真器可以推广到工业实时嵌入系统中。 展开更多
关键词 自动实时仿真 电磁瞬变 FPGA-RTS 矩阵-向量乘法器 求解器 单相接地故障
下载PDF
基于光学向量矩阵乘法器的光学信息处理系统研究 被引量:1
8
作者 卢洋洋 周平 +2 位作者 朱巍巍 张磊 杨林 《光电子.激光》 EI CAS CSCD 北大核心 2013年第9期1656-1661,共6页
光学向量-矩阵乘法器(OVMM)作为一种利用光学方式进行向量-矩阵运算(VMM)的光学系统,由于采用天然具有高带宽、高并行性的光学处理方式,在海量数据处理领域极具潜力。本文实现了一套基于空间OVMM的光电混合数字信号处理系统,采用自主设... 光学向量-矩阵乘法器(OVMM)作为一种利用光学方式进行向量-矩阵运算(VMM)的光学系统,由于采用天然具有高带宽、高并行性的光学处理方式,在海量数据处理领域极具潜力。本文实现了一套基于空间OVMM的光电混合数字信号处理系统,采用自主设计实现的维度为16×16的空间OVMM作为核心运算单元。实验结果显示,系统能够完成76.8G/s乘法累加(MAC)运算,满足实时数据处理对运算速度的需求。系统使用可编程逻辑器件(FPGA)作为电学协处理单元的核心组成部分,因此具有可编程性,可以满足多种不同的应用需求。 展开更多
关键词 光计算 光学向量-矩阵乘法器(OVMM) 向量-矩阵乘法运算(VMM) 可编程
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部