期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
国产SW26010-Pro处理器上3级BLAS函数众核并行优化 被引量:1
1
作者 胡怡 陈道琨 +5 位作者 杨超 马文静 刘芳芳 宋超博 孙强 史俊达 《软件学报》 EI CSCD 北大核心 2024年第3期1569-1584,共16页
BLAS(basic linear algebra subprograms)是最基本、最重要的底层数学库之一.在一个标准的BLAS库中,BLAS 3级函数涵盖的矩阵-矩阵运算尤为重要,在许多大规模科学与工程计算应用中被广泛调用.另外,BLAS 3级属于计算密集型函数,对充分发... BLAS(basic linear algebra subprograms)是最基本、最重要的底层数学库之一.在一个标准的BLAS库中,BLAS 3级函数涵盖的矩阵-矩阵运算尤为重要,在许多大规模科学与工程计算应用中被广泛调用.另外,BLAS 3级属于计算密集型函数,对充分发挥处理器的计算性能有至关重要的作用.针对国产SW26010-Pro处理器研究BLAS 3级函数的众核并行优化技术.具体而言,根据SW26010-Pro的存储层次结构,设计多级分块算法,挖掘矩阵运算的并行性.在此基础上,基于远程内存访问(remote memory access,RMA)机制设计数据共享策略,提高从核间的数据传输效率.进一步地,采用三缓冲、参数调优等方法对算法进行全面优化,隐藏直接内存访问(direct memory access,DMA)访存开销和RMA通信开销.此外,利用SW26010-Pro的两条硬件流水线和若干向量化计算/访存指令,还对BLAS 3级函数的矩阵-矩阵乘法、矩阵方程组求解、矩阵转置操作等若干运算进行手工汇编优化,提高了函数的浮点计算效率.实验结果显示,所提出的并行优化技术在SW26010-Pro处理器上为BLAS 3级函数带来了明显的性能提升,单核组BLAS 3级函数的浮点计算性能最高可达峰值性能的92%,多核组BLAS 3级函数的浮点计算性能最高可达峰值性能的88%. 展开更多
关键词 BLAS 3级 SW26010-Pro众核处理器 直接内存访问 远程内存访问 浮点计算效率
下载PDF
一种基于数据中心的政府信息资源整合系统架构设计 被引量:25
2
作者 王宁 王延章 +1 位作者 叶鑫 裘江南 《计算机应用研究》 CSCD 北大核心 2005年第9期67-68,71,共3页
在分析原有信息资源整合方式的基础上,通过在业务系统与数据中心间增加前置机,对以往的数据中心模式进行改进,提出一种更适应政府需求的信息资源整合系统架构。通过数据交换中心、数据交换适配器、数据库等内容以及信息流转方式的描述,... 在分析原有信息资源整合方式的基础上,通过在业务系统与数据中心间增加前置机,对以往的数据中心模式进行改进,提出一种更适应政府需求的信息资源整合系统架构。通过数据交换中心、数据交换适配器、数据库等内容以及信息流转方式的描述,对该架构的设计与实现进行了介绍。 展开更多
关键词 数据中心 前置机 信息资源整合 数据交换
下载PDF
基于Pro/E的XD-40型数控铣床专用后置处理配置文件的开发研究 被引量:1
3
作者 白皛 陶春生 马松柏 《机床与液压》 北大核心 2010年第1期56-58,130,共4页
结合某机床厂XD-40型数控机床专用后置处理配置文件的开发过程,介绍了Pro/NC模块及其GPOST后置处理器的应用,探讨特定数控机床专用后置处理配置文件开发的方法,为提高CAM类软件使用效率寻找一种全新的解决方案。
关键词 配置文件 GPOST后置处理器 后置处理 Pro/NC模块
下载PDF
基于Pro/NC的华中数控系统后置处理程序设计 被引量:2
4
作者 邓子林 《制造技术与机床》 CSCD 北大核心 2010年第9期146-148,共3页
在Pro/ENGINEER Wildfire4.0中,利用NC后置处理器功能,针对华中HNC-21M世纪星铣削数控系统进行了后置处理程序的设计,使CAM功能在国产数控系统中得到了充分的应用。
关键词 Pro/NC 华中数控 后置处理 选配文件
下载PDF
IGBT驱动保护电路的设计与测试 被引量:9
5
作者 胡宇 吕征宇 《机电工程》 CAS 2008年第7期58-60,71,共4页
在分析了绝缘栅双极性晶体管(IGBT)动态开关特性和过流状态下的电气特性的基础上,对常规的IGBT推挽驱动电路进行了改进,得到了具有良好过流保护特性的IGBT驱动电路。实践应用证明该电路结构简单,使用可靠,易于操作,配合数字信号处理器(D... 在分析了绝缘栅双极性晶体管(IGBT)动态开关特性和过流状态下的电气特性的基础上,对常规的IGBT推挽驱动电路进行了改进,得到了具有良好过流保护特性的IGBT驱动电路。实践应用证明该电路结构简单,使用可靠,易于操作,配合数字信号处理器(DSP)等控制芯片能达到很好的驱动效果。 展开更多
关键词 绝缘栅双极性晶体管 开关特性 数字信号处理器 过流保护 场效应晶体管
下载PDF
KX-P1121打印机与MCS51系列单片机的接口和编程
6
作者 傅凌才 《湖南农业大学学报(自然科学版)》 CAS CSCD 1995年第4期397-401,共5页
介绍了KX-P1121打印机与MCS51单片机的接口和编程,给出了中文的打印方法和源程序.
关键词 打印机 接口设备 编辑程序 语言程序 微机
下载PDF
电液比例系统的控制策略
7
作者 罗安 《中南工业大学学报》 CSCD 1995年第1期114-118,共5页
以电液比例位置系统为对象,研究鲁棒控制和2种智能控制,提出简便且易子实现的实时修改控制器参数方法,实验和仿真结果表明:作者提出的控制策略具有良好的控制性能,对被控对象负载和参数变化有良好的适应性;此外,系统结构简单,... 以电液比例位置系统为对象,研究鲁棒控制和2种智能控制,提出简便且易子实现的实时修改控制器参数方法,实验和仿真结果表明:作者提出的控制策略具有良好的控制性能,对被控对象负载和参数变化有良好的适应性;此外,系统结构简单,执行时间短,可广泛地应用于其它工业控制领域中。 展开更多
关键词 鲁棒控制 智能控制 单片机 电液比例 控制
下载PDF
基于pro/e数控加工后处理技术研究 被引量:1
8
作者 潘祝新 郭勇 王继群 《科技信息》 2011年第17期122-123,共2页
基于ProE野火版5.0软件,研究数控系统的后置处理选配文件。本文描述了后置处理文件的创建过程,使得CAM技术充分利用各种不同数控系统。
关键词 数控系统 后置处理 PRO/E
下载PDF
单片机应用系统中采用8279扩展“米”字形LED显示器
9
作者 廖智 伍萍辉 《湖南工程学院学报(自然科学版)》 2000年第2期27-30,47,共5页
介绍了在单片机应用系统中采用8279扩展16段“米”字形LED显示器的电路及实现方法。
关键词 单片机应用系统 “米”字形LED显示器 可编程键盘显示接口
下载PDF
基于Virtex-Ⅱ Pro的双核系统构建
10
作者 吕平 赵明生 《电子技术应用》 北大核心 2011年第7期51-53,共3页
基于Xilinx的Virtex-Ⅱ Pro开发板实现了双PowerPC405核硬件系统构建,支持对共享存储器的访问及共享串口输出。重点给出了系统的构建方法及共享资源控制机制,测试结果验证了系统的可行性。
关键词 双核 PowerPC405 Virtex-Ⅱ PRO MUTEX
下载PDF
基于DSP的电能质量在线检测装置的研究 被引量:2
11
作者 王晓光 《仪器仪表用户》 2008年第6期11-12,46,共3页
设计一种基于DSP的电能质量在线检测装置。为达到电量采样和分析同步进行,一方面采用TMS320C5509作为处理器,另一方面通过CPLD来完成系统的逻辑控制;为把检测装置的分析结果可靠地传输给远方的控制分析中心,采用了目前工业控制中比较成... 设计一种基于DSP的电能质量在线检测装置。为达到电量采样和分析同步进行,一方面采用TMS320C5509作为处理器,另一方面通过CPLD来完成系统的逻辑控制;为把检测装置的分析结果可靠地传输给远方的控制分析中心,采用了目前工业控制中比较成熟的CAN通讯方式。 展开更多
关键词 电能质量 数字信号处理器 复杂可编程逻辑控制器件 电力系统
下载PDF
面向SW26010-Pro的1、2级BLAS函数众核并行优化技术
12
作者 胡怡 陈道琨 +5 位作者 杨超 刘芳芳 马文静 尹万旺 袁欣辉 林蓉芬 《软件学报》 EI CSCD 北大核心 2023年第9期4421-4436,共16页
BLAS (basic linear algebra subprograms)是高性能扩展数学库的一个重要模块,广泛应用于科学与工程计算领域. BLAS 1级提供向量-向量运算, BLAS 2级提供矩阵-向量运算.针对国产SW26010-Pro众核处理器设计并实现了高性能BLAS 1、2级函数... BLAS (basic linear algebra subprograms)是高性能扩展数学库的一个重要模块,广泛应用于科学与工程计算领域. BLAS 1级提供向量-向量运算, BLAS 2级提供矩阵-向量运算.针对国产SW26010-Pro众核处理器设计并实现了高性能BLAS 1、2级函数.基于RMA通信机制设计了从核归约策略,提升了BLAS 1、2级若干函数的归约效率.针对TRSV、TPSV等存在数据依赖关系的函数,提出了一套高效并行算法,该算法通过点对点同步维持数据依赖关系,设计了适用于三角矩阵的高效任务映射机制,有效减少了从核点对点同步的次数,提高了函数的执行效率.通过自适应优化、向量压缩、数据复用等技术,进一步提升了BLAS 1、2级函数的访存带宽利用率.实验结果显示, BLAS 1级函数的访存带宽利用率最高可达95%,平均可达90%以上, BLAS 2级函数的访存带宽利用率最高可达98%,平均可达80%以上.与广泛使用的开源数学库GotoBLAS相比, BLAS 1、2级函数分别取得了平均18.78倍和25.96倍的加速效果. LU分解、QR分解以及对称特征值问题通过调用所提出的高性能BLAS 1、2级函数取得了平均10.99倍的加速效果. 展开更多
关键词 BLAS 1级 BLAS 2级 访存带宽 SW26010-Pro众核处理器 RMA通信 点对点同步 自适应优化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部