期刊文献+
共找到61篇文章
< 1 2 4 >
每页显示 20 50 100
Cooperative Computing Techniques for a Deeply Fused and Heterogeneous Many-Core Processor Architecture 被引量:13
1
作者 郑方 李宏亮 +3 位作者 吕晖 过锋 许晓红 谢向辉 《Journal of Computer Science & Technology》 SCIE EI CSCD 2015年第1期145-162,共18页
Due to advances in semiconductor techniques, many-core processors have been widely used in high performance computing. However, many applications still cannot be carried out efficiently due to the memory wall, which h... Due to advances in semiconductor techniques, many-core processors have been widely used in high performance computing. However, many applications still cannot be carried out efficiently due to the memory wall, which has become a bottleneck in many-core processors. In this paper, we present a novel heterogeneous many-core processor architecture named deeply fused many-core (DFMC) for high performance computing systems. DFMC integrates management processing ele- ments (MPEs) and computing processing elements (CPEs), which are heterogeneous processor cores for different application features with a unified ISA (instruction set architecture), a unified execution model, and share-memory that supports cache coherence. The DFMC processor can alleviate the memory wall problem by combining a series of cooperative computing techniques of CPEs, such as multi-pattern data stream transfer, efficient register-level communication mechanism, and fast hardware synchronization technique. These techniques are able to improve on-chip data reuse and optimize memory access performance. This paper illustrates an implementation of a full system prototype based on FPGA with four MPEs and 256 CPEs. Our experimental results show that the effect of the cooperative computing techniques of CPEs is significant, with DGEMM (double-precision matrix multiplication) achieving an efficiency of 94%, FFT (fast Fourier transform) obtaining a performance of 207 GFLOPS and FDTD (finite-difference time-domain) obtaining a performance of 27 GFLOPS. 展开更多
关键词 heterogeneous many-core processor data stream transfer register-level communication mechanism hardwaresynchronization technique processor prototype
原文传递
Thread Private Variable Access Optimization Technique for Sunway High-Performance Multi-core Processors
2
作者 Jinying Kong Kai Nie +2 位作者 Qinglei Zhou Jinlong Xu Lin Han 《国际计算机前沿大会会议论文集》 2021年第1期180-189,共10页
The primary way to achieve thread-level parallelism on the Sunwayhigh-performance multicore processor is to use the OpenMP programming technique.To address the problem of low parallelism efficiency caused by slow acce... The primary way to achieve thread-level parallelism on the Sunwayhigh-performance multicore processor is to use the OpenMP programming technique.To address the problem of low parallelism efficiency caused by slow accessto thread private variables in the compilation of Sunway OpenMP programs, thispaper proposes a thread private variable access technique based on privilegedinstructions. The privileged instruction-based thread-private variable access techniquecentralizes the implementation of thread-private variables at the compilerlevel, eliminating the model switching overhead of invoking OS core processingand improving the speed of accessing thread-private variables. On the Sunway1621 server platform, NPB3.3-OMP and SPEC OMP2012 achieved 6.2% and6.8% running efficiency gains, respectively. The results show that the techniquesproposed in this paper can provide technical support for giving full play to theadvantages of Sunway’s high-performance multi-core processors. 展开更多
关键词 Sunway high-performance multi-core processors OpenMP programming technique Privileged instruction-based thread-private variable access technique Sunway 1621 processor
原文传递
Parallel Region Reconstruction Technique for Sunway High-Performance Multi-core Processors
3
作者 Kai Nie Qinglei Zhou +3 位作者 Hong Qian Jianmin Pang Jinlong Xu Yapeng Li 《国际计算机前沿大会会议论文集》 2021年第1期163-179,共17页
The leading way to achieve thread-level parallelism on the Sunwayhigh-performance multicore processors is to use OpenMP programming techniques.In order to address the problem of low parallel efficiency caused by hight... The leading way to achieve thread-level parallelism on the Sunwayhigh-performance multicore processors is to use OpenMP programming techniques.In order to address the problem of low parallel efficiency caused by highthread group control overhead in the compilation of Sunway OpenMP programs,this paper proposes the parallel region reconstruction technique. The parallelregion reconstruction technique expands the parallel scope of parallel regionsin OpenMP programs by parallel region merging and parallel region extending.Moreover, it reduces the number of parallel regions in OpenMP programs,decreases the overhead of frequent creation and convergence of thread groups,and converts standard fork-join model OpenMP programs to higher performanceSPMD modelOpenMP programs. On the Sunway 1621 server computer, NPB3.3-OMP and SPEC OMP2012 achieved 8.9% and 7.9% running efficiency improvementrespectively through parallel region reconstruction technique. As a result,the parallel region reconstruction technique is feasible and effective. It providestechnical support to fully exploit the multi-core parallelism advantage of Sunway’shigh-performance processors. 展开更多
关键词 Sunway high-performance multi-core processors OpenMP programming technique Parallel domain reconstruction technique
原文传递
电磁脉冲对数字信号处理器的干扰及其防护 被引量:9
4
作者 王彦 焦红灵 +4 位作者 车文荃 何山红 熊瑛 潘超 冯德仁 《强激光与粒子束》 EI CAS CSCD 北大核心 2013年第8期2173-2176,共4页
为寻找有效的电磁脉冲防护加固措施,首先对电磁脉冲模拟器的干扰路径进行分析,包括数字信号处理器(DSP)与放电回路的共地耦合干扰及共网电耦合干扰,并将结构优化设计、硬件屏蔽加固措施与设置软件陷阱、开启看门狗等抗干扰措施相结合,... 为寻找有效的电磁脉冲防护加固措施,首先对电磁脉冲模拟器的干扰路径进行分析,包括数字信号处理器(DSP)与放电回路的共地耦合干扰及共网电耦合干扰,并将结构优化设计、硬件屏蔽加固措施与设置软件陷阱、开启看门狗等抗干扰措施相结合,对数字信号处理器(DSP)内核工作电压、输入/输出(I/O)端口以及显示屏等进行了干扰测试。实验结果表明,采用硬件与软件相结合的防护加固技术后,DSP主板的内核工作电压及I/O端口的干扰脉冲幅值减小,且干扰持续时间由2μs减少到400 ns,干扰脉冲获得了有效抑制。 展开更多
关键词 电磁脉冲 数字信号处理器 耦合 软件加固技术 防护 抗干扰
下载PDF
基于EDA技术的图像边缘检测协处理器的设计 被引量:7
5
作者 谭会生 桂卫华 刘展良 《包装工程》 CAS CSCD 北大核心 2004年第6期102-104,107,共4页
在嵌入式图形系统处理领域 ,图像处理的速度问题一直是一个很难突破的设计瓶颈。文章在介绍一种全新的DSP +CPLD图像处理系统工作原理的基础上 ,阐述了一个基于EDA技术的、用FPGA实现的 80 0× 6 0 0像素的图像边缘检测协处理器的设... 在嵌入式图形系统处理领域 ,图像处理的速度问题一直是一个很难突破的设计瓶颈。文章在介绍一种全新的DSP +CPLD图像处理系统工作原理的基础上 ,阐述了一个基于EDA技术的、用FPGA实现的 80 0× 6 0 0像素的图像边缘检测协处理器的设计 ,包括边缘检测算法选择、系统的FPGA实现设计和有关仿真结果等。该协处理器的像素处理方式采用全硬件并行及流水线技术 ,比单独采用单片机和DSP的系统 ,其处理速度分别提高了 4 0 0倍和 10倍 ,同时该系统集成在一块集成芯片上 ,体积小 ,功耗低 ,可靠性高 ,并可现场编程 。 展开更多
关键词 EDA技术 图像边缘检测协处理器 SOBEL算法 DSP+CPLD 并行流水技术
下载PDF
基于总线技术和数据融合的嵌入式汽车仪表系统 被引量:2
6
作者 罗文广 杨叙 +2 位作者 吴彤峰 毛汉颖 陈文辉 《传感器与微系统》 CSCD 北大核心 2008年第8期94-96,共3页
研制一种新型的汽车仪表系统。该系统以CAN总线为车载网络,连接显示节点和测量节点,并采用液晶显示方式。显示节点以嵌入式控制器为核心,测量节点则以PIC单片机为核心。采用两级数据融合技术,包括初始数据融合和决策级数据融合,前者可... 研制一种新型的汽车仪表系统。该系统以CAN总线为车载网络,连接显示节点和测量节点,并采用液晶显示方式。显示节点以嵌入式控制器为核心,测量节点则以PIC单片机为核心。采用两级数据融合技术,包括初始数据融合和决策级数据融合,前者可提高数据的测量精度,后者则提供安全决策辅助,即增加了汽车仪表系统的功能。测量实例表明了这些技术和方法运用的有效性和准确性。 展开更多
关键词 汽车仪表 总线技术 嵌入式控制器 单片机 数据融合
下载PDF
微小型导航系统中高精度导航计算机设计 被引量:4
7
作者 孙永荣 刘建业 +1 位作者 刘瑞华 杜亚玲 《传感器与微系统》 CSCD 北大核心 2006年第10期54-56,63,共4页
通过分析微小型组合导航系统中导航计算机的功能要求,确定了导航计算机的硬件设计指标。提出以高性能浮点型TMS320C6713数字信号处理器(DSP)为核心处理器芯片,设计了高速18位差分A/D转换电路、16位D/A转换电路等多种接口电路,运用现场... 通过分析微小型组合导航系统中导航计算机的功能要求,确定了导航计算机的硬件设计指标。提出以高性能浮点型TMS320C6713数字信号处理器(DSP)为核心处理器芯片,设计了高速18位差分A/D转换电路、16位D/A转换电路等多种接口电路,运用现场可编程逻辑技术有效地降低了系统设计复杂度。设计并实现了可靠的程序实现流程,使捷联惯性航姿系统脱离通用计算机平台。实验证明:基于DSP的组合导航系统的精度和实时性能够达到设计要求,并且,便携、价廉,对导航系统在微小型领域的广泛使用具有实际意义。 展开更多
关键词 数字信号处理器 嵌入式系统 组合导航系统 现场可编程逻辑技术
下载PDF
圆度误差检测的现状与展望 被引量:14
8
作者 闵莉 吴玉厚 富大伟 《沈阳建筑工程学院学报》 1999年第3期273-277,共5页
介绍圆度误差检测的仪器、在线测量、误差分离技术等方面的研究概况,并展望了圆度误差检测的发展趋势.
关键词 在线测量 误差分离 圆度误差 检测
下载PDF
多媒体处理器的SIMD代码生成 被引量:2
9
作者 吴圣宁 李思昆 《计算机科学》 CSCD 北大核心 2007年第7期268-270,共3页
通用处理器的SIMD(Single Instruction Multiple Data)多媒体扩展,为提高多媒体应用的性能提供了新的体系结构支持。但目前编译技术对这类指令不能提供很好的支持。本文提出了一个新的SIMD指令生成算法,基于把编译器前端的程序分析和编... 通用处理器的SIMD(Single Instruction Multiple Data)多媒体扩展,为提高多媒体应用的性能提供了新的体系结构支持。但目前编译技术对这类指令不能提供很好的支持。本文提出了一个新的SIMD指令生成算法,基于把编译器前端的程序分析和编译器后端的机器信息相结合的思想,采用扩展的tree parsing技术,有效识别程序中的并行操作以生成SIMD指令。基于SUIF(Stanford University Intermediate Format)[1]编译器框架的实验表明,针对一组多媒体kernel,本文提出的算法可平均减少其非SIMD代码47%的cycles。 展开更多
关键词 多媒体处理器 SIMD 编译技术
下载PDF
便携式雷达维修辅助设备的设计与实现 被引量:3
10
作者 张永祯 周晶晶 林慧贞 《现代雷达》 CSCD 北大核心 2013年第7期63-66,共4页
在分析野战环境下雷达维修需求的基础上,研制了适用于一种雷达基层级维修的便携式维修辅助设备,该设备在集成万用表和示波器表的基础上,加载雷达装备的电子技术手册,实现了现场的检测仪器和雷达维修信息整合。文中在介绍该设备功能的基... 在分析野战环境下雷达维修需求的基础上,研制了适用于一种雷达基层级维修的便携式维修辅助设备,该设备在集成万用表和示波器表的基础上,加载雷达装备的电子技术手册,实现了现场的检测仪器和雷达维修信息整合。文中在介绍该设备功能的基础上,阐述了便携式维修辅助设备的硬件构成,及装备维修信息系统的软件设计。该便携式维修辅助设备已经应用于雷达维修,取得了良好效果。 展开更多
关键词 便携式维修辅助设备 电子技术手册 ARM处理器 雷达维修设备
下载PDF
基于存储技术的高速嵌入式处理器的设计与实现 被引量:2
11
作者 张钦 韩承德 《计算机学报》 EI CSCD 北大核心 2007年第5期831-837,共7页
SoPC(片上可编程系统,System on a Programmable Chip)在嵌入式系统中有着广泛的应用,通常用FPGA(现场可编程门阵列,Field Programmable Gate Array)实现.一类嵌入式处理器,例如小波变换处理器、压缩和解压缩处理器、FFT处理器,都可以... SoPC(片上可编程系统,System on a Programmable Chip)在嵌入式系统中有着广泛的应用,通常用FPGA(现场可编程门阵列,Field Programmable Gate Array)实现.一类嵌入式处理器,例如小波变换处理器、压缩和解压缩处理器、FFT处理器,都可以采用基于存储技术的设计方法.FPGA的片内存储资源相对较少,如何有效地利用FPGA的片内存储资源实现高速的嵌入式处理器成为需要研究的问题.文中以FFT处理器为例说明这种方法的有效性,通过采用一种地址映射调度策略和两种无冲突操作数地址映射方式,减少了所使用的FPGA片内存储资源,提高了处理速度.该FFT处理器在实际系统中起到了关键作用. 展开更多
关键词 存储技术 嵌入式处理器 FFT处理器 地址映射调度策略 无冲突操作数地址映射方式 SOPC
下载PDF
激光测风雷达二维扫描控制系统的实现 被引量:1
12
作者 邹丽新 董晶晶 +3 位作者 朱桂荣 汤荣生 季晶晶 孙东松 《大气与环境光学学报》 CAS 2006年第6期184-187,共4页
二维扫描系统使得激光出射方向和光学接收光轴同时精确指向设定方向,进而测量多方位的风速数据。介绍了激光测风雷达二维扫描控制系统组成,重点讨论了系统运用步进电机进行驱动的电路特点以及采取的可靠性技术措施,包括硬件措施和软件措... 二维扫描系统使得激光出射方向和光学接收光轴同时精确指向设定方向,进而测量多方位的风速数据。介绍了激光测风雷达二维扫描控制系统组成,重点讨论了系统运用步进电机进行驱动的电路特点以及采取的可靠性技术措施,包括硬件措施和软件措施,分析了该系统的先进性、可靠性以及智能化特点。该控制系统已经成功地安装在中国科学院安徽光机所的激光测风雷达上,经过了一年半的实际运行,其控制精度、运行速度完全满足激光测风雷达的测量要求。 展开更多
关键词 激光技术 控制系统 激光测风雷达 微处理器 可靠性
下载PDF
核地球物理学的X射线荧光技术在我国固体矿产资源中的研究与应用 被引量:4
13
作者 章晔 谢庭周 +1 位作者 周四春 葛良全 《地球物理学报》 SCIE EI CAS CSCD 北大核心 1989年第4期441-449,共9页
本文概述:1.理论研究及基体效应的校正;2.本文作者设计与发展的HYX-1轻便型X射线荧光仪、HYX-2轻便型双道X射线荧光仪、HYX-3微型机400道X射线荧光仪、JXY-1X射线荧光测井仪以及用于各型轻便型X射线荧光仪的找金矿滤波器;3.用于Fe、Mn... 本文概述:1.理论研究及基体效应的校正;2.本文作者设计与发展的HYX-1轻便型X射线荧光仪、HYX-2轻便型双道X射线荧光仪、HYX-3微型机400道X射线荧光仪、JXY-1X射线荧光测井仪以及用于各型轻便型X射线荧光仪的找金矿滤波器;3.用于Fe、Mn、Cu、Ni、Cr、Zn、Pb、Sr、Mo、As、Sn、sb、Ba、W、Hg、Au、K、P等矿种的勘查或开采中的测定。实践表明,核地球物理学的X射线荧光技术在勘探和生产中是有效而经济的工具。 展开更多
关键词 核地球物理 X射线荧光法 固体矿产
下载PDF
一种在线非接触式型钢长度测量仪的设计 被引量:1
14
作者 肖峻 汤春球 +2 位作者 莫易敏 胡国庆 高尚华 《传感器技术》 CSCD 北大核心 2002年第9期29-30,33,共3页
采用高精度线阵电荷耦合器件测量技术、光电检测技术、单片机技术设计了一种在线非接触式型钢长度测量系统,并介绍测量系统的基本工作原理和软硬件组成。实践证明,该测量仪满足实际生产要求,具有一定的开发价值。
关键词 电荷耦合器件 在线非接触式测量 单片机技术
下载PDF
基于嵌入式视频多媒体集中控制系统实现的关键技术研究 被引量:2
15
作者 郭向勇 吕利昌 何晓青 《现代电子技术》 2008年第4期53-55,65,共4页
针对嵌入式视频的多媒体网络中央控制系统的技术发展,提出基于32位微处理器MCF5249+μClinux嵌入式视频多媒体集控系统构架的实现方法。着重阐述系统采用32位微处理器MCF5249为硬件平台,实现嵌入式μClinux操作系统的裁剪与移植和专用... 针对嵌入式视频的多媒体网络中央控制系统的技术发展,提出基于32位微处理器MCF5249+μClinux嵌入式视频多媒体集控系统构架的实现方法。着重阐述系统采用32位微处理器MCF5249为硬件平台,实现嵌入式μClinux操作系统的裁剪与移植和专用控件封装技术在嵌入式视频技术中的应用等构架系统平台的关键技术与安全性设计等内容。 展开更多
关键词 嵌入式μClinux操作系统 嵌入式视频 MCF5249 32位微处理器 专用控件封装技术
下载PDF
LCD模块与单片机的串行接口技术 被引量:2
16
作者 黄竹霞 《传感器技术》 CSCD 北大核心 2002年第11期50-51,共2页
介绍字符型LCD显示模块与单片机AT89C2 0 5 1的接口技术。该接口技术基于数据的串行发送方式 ,它具有硬件电路简化、紧凑、可靠的特点 ,用途广泛。
关键词 LCD模块 单片机 串行接口技术 液晶显示 AT89C2051
下载PDF
TMS320F2812片内Flash在线烧写技术研究 被引量:14
17
作者 李静 张树团 《国外电子元器件》 2008年第10期37-38,40,共3页
基于TMS320F2812内部Flash在线烧写技术,提出了一种串口烧写Flash技术。详细论述了烧写技术的实现步骤,给出了关键部分的程序代码。通过对比发现,基于JTAG接口烧写技术常用于调试阶段,而串口烧写技术能够应用于一些特殊场合,并能提高系... 基于TMS320F2812内部Flash在线烧写技术,提出了一种串口烧写Flash技术。详细论述了烧写技术的实现步骤,给出了关键部分的程序代码。通过对比发现,基于JTAG接口烧写技术常用于调试阶段,而串口烧写技术能够应用于一些特殊场合,并能提高系统的可维护性。 展开更多
关键词 控制器 存储器 接口 自动控制/数字信号处理器 烧写技术 TMS320F2812
下载PDF
盘式制动器热弹性不稳定性的有限元分析 被引量:1
18
作者 王欲进 李晓明 《太原理工大学学报》 CAS 北大核心 2012年第6期766-769,共4页
采用有限元分析法分析盘式制动器热弹性不稳定性,建立了三维盘式制动器热力学分析模型,基于交错接触的中间处理器用来交换结果数据:温度,摩擦接触力,位移和变形。对制动盘的厚度变化(DTV)和温度的分布进行了计算,验证了有限元模型的可靠... 采用有限元分析法分析盘式制动器热弹性不稳定性,建立了三维盘式制动器热力学分析模型,基于交错接触的中间处理器用来交换结果数据:温度,摩擦接触力,位移和变形。对制动盘的厚度变化(DTV)和温度的分布进行了计算,验证了有限元模型的可靠性,并确认了计算方案。为盘式制动器的选材、结构设计以及磨损提供了理论依据,对制动的振动和噪声研究有很好的工程使用价值。 展开更多
关键词 盘式制动器 热弹性不稳定 有限元分析 热机械分析 中间处理器 制动盘厚度
下载PDF
LCD液晶显示模块在工程装备计时系统中应用 被引量:2
19
作者 袁建虎 尤峻 黄石红 《微计算机信息》 2003年第2期48-49,共2页
 介绍字符型LCD显示模块与单片机AT89C2051的接口技术,该接口技术基于数据的串行发送方式,它具有硬件电路简化、紧凑、可靠的特点,用途广泛。并给出在工程装备计时中的应用。
关键词 LCD液晶显示模块 工程装备计量系统 单片机 智能仪表 接口技术
下载PDF
彩色电视中的倍频扫描技术
20
作者 邹艳碧 吴智量 李朝晖 《广州大学学报(自然科学版)》 CAS 2003年第4期333-336,340,共5页
阐述了数字技术在传统模拟彩色电视中的应用 ,对如何通过倍频扫描技术解决普通模拟电路技术问题进行分析 ,介绍了国外最新的数字信号处理器DSP提高传统彩电图像清晰度的方法 .
关键词 数字技术 倍频技术 NV320芯片 数字信号处理
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部