期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
Speeding up the MATLAB complex networks package using graphic processors 被引量:1
1
作者 张百达 唐玉华 +1 位作者 吴俊杰 李鑫 《Chinese Physics B》 SCIE EI CAS CSCD 2011年第9期460-467,共8页
The availability of computers and communication networks allows us to gather and analyse data on a far larger scale than previously. At present, it is believed that statistics is a suitable method to analyse networks ... The availability of computers and communication networks allows us to gather and analyse data on a far larger scale than previously. At present, it is believed that statistics is a suitable method to analyse networks with millions, or more, of vertices. The MATLAB language, with its mass of statistical functions, is a good choice to rapidly realize an algorithm prototype of complex networks. The performance of the MATLAB codes can be further improved by using graphic processor units (GPU). This paper presents the strategies and performance of the GPU implementation of a complex networks package, and the Jacket toolbox of MATLAB is used. Compared with some commercially available CPU implementations, GPU can achieve a speedup of, on average, 11.3x. The experimental result proves that the GPU platform combined with the MATLAB language is a good combination for complex network research. 展开更多
关键词 complex networks graphic processors unit MATLAB Jacket Toolbox
下载PDF
NM-SpMM:面向国产异构向量处理器的半结构化稀疏矩阵乘算法
2
作者 姜晶菲 何源宏 +2 位作者 许金伟 许诗瑶 钱希福 《计算机工程与科学》 CSCD 北大核心 2024年第7期1141-1150,共10页
深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产... 深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产异构向量处理器FT-M7032为智能模型处理中的数据并行和指令并行开发提供了较大空间。针对N∶M半结构化稀疏模型计算稀疏模式多样性,提出了一种面向FT-M7032的可灵活配置的稀疏矩阵乘算法NM-SpMM。NM-SpMM设计了一种高效的压缩偏移地址稀疏编码格式COA,避免了半结构化参数配置对稀疏数据访存计算的影响。基于COA编码,NM-SpMM对不同维度稀疏矩阵计算进行了细粒度优化。在FT-M7032单核上的实验结果表明,相较于稠密矩阵乘,NM-SpMM能获得1.73~21.00倍的加速,相较于采用CuSPARSE稀疏计算库的NVIDIA V100 GPU,能获得0.04~1.04倍的加速。 展开更多
关键词 深度神经网络 图形处理器 向量处理器 稀疏矩阵乘 流水线
下载PDF
基于数据-模型混合驱动的电力系统机电暂态快速仿真方法
3
作者 王鑫 杨珂 +3 位作者 黄文琦 马云飞 耿光超 江全元 《中国电机工程学报》 EI CSCD 北大核心 2024年第8期2955-2964,I0002,共11页
数据驱动建模方法改变了发电机传统的建模范式,导致传统的机电暂态时域仿真方法无法直接应用于新范式下的电力系统。为此,该文提出一种基于数据-模型混合驱动的机电暂态时域仿真(data and physics driven time domain simulation,DPD-T... 数据驱动建模方法改变了发电机传统的建模范式,导致传统的机电暂态时域仿真方法无法直接应用于新范式下的电力系统。为此,该文提出一种基于数据-模型混合驱动的机电暂态时域仿真(data and physics driven time domain simulation,DPD-TDS)算法。算法中发电机状态变量与节点注入电流通过数据驱动模型推理计算,并通过网络方程完成节点电压计算,两者交替求解完成仿真。算法提出一种混合驱动范式下的网络代数方程组预处理方法,用以改善仿真的收敛性;算法设计一种中央处理器单元-神经网络处理器单元(central processing unit-neural network processing unit,CPU-NPU)异构计算框架以加速仿真,CPU进行机理模型的微分代数方程求解;NPU作协处理器完成数据驱动模型的前向推理。最后在IEEE-39和Polish-2383系统中将部分或全部发电机替换为数据驱动模型进行验证,仿真结果表明,所提出的仿真算法收敛性好,计算速度快,结果准确。 展开更多
关键词 机电暂态 时域仿真 数据-模型混合驱动 收敛性 CPU-npu异构运算
下载PDF
实时车牌识别边缘系统设计及FPGA实现 被引量:2
4
作者 汤诺辉 林志坚 +1 位作者 陈平平 郭里婷 《福州大学学报(自然科学版)》 CAS 北大核心 2023年第3期333-339,共7页
为解决边缘设备端车牌识别系统适应性差和识别率低的问题,提出一种基于深度学习处理单元(DPU)的车牌识别系统设计方法.该方法首先将车牌识别网络进行改造使其可在DPU上运行,并通过压缩与激励(SE)模块组合优化神经网络识别率.将DPU部署... 为解决边缘设备端车牌识别系统适应性差和识别率低的问题,提出一种基于深度学习处理单元(DPU)的车牌识别系统设计方法.该方法首先将车牌识别网络进行改造使其可在DPU上运行,并通过压缩与激励(SE)模块组合优化神经网络识别率.将DPU部署在现场可编程门阵列(FPGA)上,调用神经网络对视频图像进行车牌识别,设计出可兼顾新能源车牌的车牌识别系统.实验结果表明,以大规模数据集作为图像输入,车牌识别系统的平均识别准确率可达94.1%,运行速率可达4 ms. 展开更多
关键词 车牌识别 深度学习处理单元 神经网络 现场可编程门阵列
下载PDF
RS-485/Modbus在FFU控制系统中的应用 被引量:17
5
作者 汪义旺 崔鸣 祁春清 《自动化仪表》 CAS 北大核心 2010年第6期39-41,44,共4页
为了满足多风机过滤器单元(FFU)群控系统的需要,设计了一种基于RS-485/Modbus的FFU控制系统。系统采用RS-485总线组网,并通过Modbus协议实现数据传输和FFU网络群控。实验和工程应用结果验证了该系统设计方案的正确性和可靠性,为实现FFU... 为了满足多风机过滤器单元(FFU)群控系统的需要,设计了一种基于RS-485/Modbus的FFU控制系统。系统采用RS-485总线组网,并通过Modbus协议实现数据传输和FFU网络群控。实验和工程应用结果验证了该系统设计方案的正确性和可靠性,为实现FFU的网络化和自动化控制提供了一种有效的解决途径。 展开更多
关键词 RS-485/Modbus 控制系统 数字信号处理器 网络化 自动化 风机过滤单元
下载PDF
基于MPC8260与NP7250微码通信模块的设计与实现 被引量:1
6
作者 贺冰琰 姜帅 《海南师范大学学报(自然科学版)》 CAS 2011年第3期274-278,共5页
文章给出了基于AMCC的NP7250、NPX5700和NPX5800交换套片的全IP交换平台的构建方案,重点介绍了在高性能的网络处理器NP7250和嵌入式微处理器MPC8260之间的微码通信模块的设计与实现的方法,微码通信模块由两个部分组成:处于用户数据面(... 文章给出了基于AMCC的NP7250、NPX5700和NPX5800交换套片的全IP交换平台的构建方案,重点介绍了在高性能的网络处理器NP7250和嵌入式微处理器MPC8260之间的微码通信模块的设计与实现的方法,微码通信模块由两个部分组成:处于用户数据面(网络处理器侧)的通信模块UCOM和控制面(主CPU侧)的通信任务UCOM_TASK. 展开更多
关键词 微码子系统 网络处理器单元 ViX接口版本3 VXWORKS
下载PDF
基于W5300在测试系统通信接口的应用研究 被引量:7
7
作者 强明辉 李东蔚 《工业仪表与自动化装置》 2016年第5期49-51,95,共4页
针对传统现场总线具有不易组网、远程监控困难等问题,研究了以太网控制芯片W5300与嵌入式处理器的以太网通信及接口连接。结合以太网支持TCP/IP协议的优势,完成了自动测试设备开关矩阵与计算机之间高速稳定的双向通信。该接口通信方式... 针对传统现场总线具有不易组网、远程监控困难等问题,研究了以太网控制芯片W5300与嵌入式处理器的以太网通信及接口连接。结合以太网支持TCP/IP协议的优势,完成了自动测试设备开关矩阵与计算机之间高速稳定的双向通信。该接口通信方式具有高效性、高可靠性,可广泛应用于多信道的分布式测试系统中。 展开更多
关键词 自动测试系统 网络接口芯片W5300 嵌入式处理器
下载PDF
一种基于分布式网络处理器系统的路由软件平台
8
作者 吉萌 余少华 《计算机科学》 CSCD 北大核心 2005年第11期31-35,共5页
由于网络处理器(NPU)结合了ASIC的高转发性能和传统RISC处理器的灵活性,目前的大容量网络设备多采用分布式NPU的架构。但因为各种NPU的体系结构和提供的API接口有较大的不同,设计者需要解决路由软件在各种硬件平台的可移植性和可扩展性... 由于网络处理器(NPU)结合了ASIC的高转发性能和传统RISC处理器的灵活性,目前的大容量网络设备多采用分布式NPU的架构。但因为各种NPU的体系结构和提供的API接口有较大的不同,设计者需要解决路由软件在各种硬件平台的可移植性和可扩展性。本文提出了一种基于分布式NPU系统的路由软件平台—EROS,该平台采用模块化和分层化的设计思想,通过数据转发适配层屏蔽了具体的硬件转发行为,简化了上层协议和网管的实现。本文介绍了 EROS的总体架构和部分实现细节。此外,本文还介绍了 EROS在实验平台DEEP上的实现和测试结果,基于DEEP平台的路由器已获得信息产业部高端路由器入网证。 展开更多
关键词 网络处理器 分布式 数据转发适配层 软件转发引擎 分布式网络 处理器系统 软件平台 路由软件 RISC处理器 高端路由器
下载PDF
聚合组播路由并行查找算法
9
作者 刘晓峰 华蓓 《计算机仿真》 CSCD 2008年第12期154-157,共4页
目前,组播主干网的核心路由器速率已经达到2.5Gbps~10Gbps,这一速率要求核心路由器每秒能够转发几百万乃至上千万个以上的分组。分组转发的重要一步就是查找路由表,因此快速的路由查找算法是实现高速分组转发的关键。为获取高性能组播... 目前,组播主干网的核心路由器速率已经达到2.5Gbps~10Gbps,这一速率要求核心路由器每秒能够转发几百万乃至上千万个以上的分组。分组转发的重要一步就是查找路由表,因此快速的路由查找算法是实现高速分组转发的关键。为获取高性能组播路由查找算法,利用位图压缩技术,结合组播路由转发表的特点,设计出一种聚合组播路由并行查找算法,最后在IXP2800网络处理器模拟环境下对算法性能进行测试,达到了OC-192的线速转发性能。该算法适用于各种多线程结构处理器,具有较高的参考价值。 展开更多
关键词 网络处理器 多核多线程 线速
下载PDF
MODBUS协议在FFU控制系统中的实现
10
作者 雷岩 王英 +1 位作者 杨利娟 郝学红 《苏州科技学院学报(自然科学版)》 CAS 2013年第2期44-47,共4页
为了满足多风机过滤器单元(FFU)群控系统的需要,设计了一种基于RS485/Modbus协议的FFU控制系统。系统采用RS485总线组网,并通过Modbus协议实现数据传输和FFU网络群控。实验和工程应用结果验证了该系统设计方案的正确性和可靠性,为实现FF... 为了满足多风机过滤器单元(FFU)群控系统的需要,设计了一种基于RS485/Modbus协议的FFU控制系统。系统采用RS485总线组网,并通过Modbus协议实现数据传输和FFU网络群控。实验和工程应用结果验证了该系统设计方案的正确性和可靠性,为实现FFU的网络化和自动化控制提供了一种有效的解决途径。 展开更多
关键词 RS485 Modbus控制系统 数字信号处理器 网络化 自动化 风机过滤单元
下载PDF
GPU加速随机线性网络编码的研究 被引量:1
11
作者 潘晓辉 《价值工程》 2012年第29期193-194,共2页
网络编码近年来被广泛用于各种分布式系统以提高吞吐量,并且能在网络发生动态变化时的数据传输提供弹性。但是,网络编码引起的大量的额外计算量和编码时间成为了实际应用的障碍。在这个研究中,我们使用GPU的强大计算能力来加速网络编码... 网络编码近年来被广泛用于各种分布式系统以提高吞吐量,并且能在网络发生动态变化时的数据传输提供弹性。但是,网络编码引起的大量的额外计算量和编码时间成为了实际应用的障碍。在这个研究中,我们使用GPU的强大计算能力来加速网络编码。通过将大量可并行的计算安排到GPU上执行,有效地缩短了网络编码所需要的时间,为网络编码的实际应用提供了帮助。 展开更多
关键词 网络编码 随机 线性 图形处理器
下载PDF
基于DSP的CAN总线智能节点设计
12
作者 宋永献 李正明 《自动化与仪表》 2006年第4期31-34,共4页
介绍数字信号处理器(DSP)和CAN总线在远动终端控制系统中的应用。为提高系统的实时响应性能和信号处理能力,在硬件上采用DSP和CPLD技术,提高了系统的集成化程度和可靠性,增强了DSP访问外设的能力。软件上采用模块化的程序设计方法,并利... 介绍数字信号处理器(DSP)和CAN总线在远动终端控制系统中的应用。为提高系统的实时响应性能和信号处理能力,在硬件上采用DSP和CPLD技术,提高了系统的集成化程度和可靠性,增强了DSP访问外设的能力。软件上采用模块化的程序设计方法,并利用D SP的中断资源,解决了多任务对CPU的同时请求以及交叉的问题,提高了系统的实时性和软件效率。 展开更多
关键词 数字信号处理器 控制器局域网总线 复杂可编程逻辑控制器 远动终端
下载PDF
基于全IP开发平台的NP7250的数据转发机制
13
作者 贺冰琰 《计算机技术与发展》 2013年第3期156-159,共4页
传统的移动网络的各个产品大多是独立开发的,没有统一的硬软件开发平台,而全IP的多业务集成开发通信平台可避免各模块独立开发存在的重复劳动。给出了一种适用于通信领域的基于AMCC的NP7250、NPX5700和NPX5800交换套片的多业务全IP开发... 传统的移动网络的各个产品大多是独立开发的,没有统一的硬软件开发平台,而全IP的多业务集成开发通信平台可避免各模块独立开发存在的重复劳动。给出了一种适用于通信领域的基于AMCC的NP7250、NPX5700和NPX5800交换套片的多业务全IP开发平台的构建方案,全IP开发平台交换结构分为两级,一级交换为Crossbar+线卡的方式,二级交换为以太网方式。重点介绍了全IP开发平台中,级连线卡NP7250的数据转发模块的设计方案,数据转发模块包括三个主要模块:1)核心路由模块;2)一级转发模块;3)二级转发模块。实现了平台上的基本信元/报文的路由转发功能。 展开更多
关键词 路由表 网络处理器单元 ViX接口版本3 线卡
下载PDF
基于VxWorks的全IP开发平台进程通信处理机制
14
作者 贺冰琰 《单片机与嵌入式系统应用》 2013年第2期38-41,共4页
给出了基于AMCC的NP7250、NPX5700和NPX5800交换套片的全IP交换平台的构建方案,重点介绍了在基于Vxworks的全IP交换平台上的进程通信模块的设计和实现方案。模块主要实现相同处理器内和不同处理器之间进程间通信功能,进程间的通信主要... 给出了基于AMCC的NP7250、NPX5700和NPX5800交换套片的全IP交换平台的构建方案,重点介绍了在基于Vxworks的全IP交换平台上的进程通信模块的设计和实现方案。模块主要实现相同处理器内和不同处理器之间进程间通信功能,进程间的通信主要依靠调度任务从邮箱中接收消息,并把消息派发到各个进程的消息队列来实现,底层协议类型包括可靠通信协议(TCP)和不可靠通信协议(UDP)。 展开更多
关键词 嵌入式操作系统 网络处理器单元 消息队列 VXWORKS
下载PDF
并行绘制系统中基于网络处理单元的图像合成及显示
15
作者 李瑞瑞 张一天 +1 位作者 秦桂明 秦开怀 《计算机应用》 CSCD 北大核心 2011年第1期11-15,32,共6页
随着绘制任务复杂度和绘制数据规模不断增长,使用PC集群进行分布式并行绘制是一个常用的解决方案。sort-last分布式并行绘制方法具有好的扩展性和负载平衡,但由于图像合成瓶颈的限制,绘制速度不能满足实时需求。提出一个使用网络处理单... 随着绘制任务复杂度和绘制数据规模不断增长,使用PC集群进行分布式并行绘制是一个常用的解决方案。sort-last分布式并行绘制方法具有好的扩展性和负载平衡,但由于图像合成瓶颈的限制,绘制速度不能满足实时需求。提出一个使用网络处理单元(NPU)来进行快速硬件图像合成的方法,开发了一个sort-last并行绘制系统NPUPR。实验表明,针对4个绘制节点,基于NPU的硬件图像合成方法与direct send的合成算法相比,绘制速度有了4倍的提高。也给出通过增加网络处理单元来扩展系统支持更多绘制节点的方案,分析表明,系统图像合成性能不会随节点个数的增加而明显降低。 展开更多
关键词 并行绘制 图像合成 分布式集群 硬件加速 网络处理单元
下载PDF
基于DPU的低功耗嵌入式手势识别系统设计 被引量:2
16
作者 黎海涛 刘鸣 张帅 《北京信息科技大学学报(自然科学版)》 2021年第3期1-7,共7页
为了解决嵌入式手势识别系统的速度慢和功耗高的问题,提出基于深度学习处理单元(deep-learning processor unit,DPU)的手势识别系统设计方法。通过把DPU部署于现场可编程门阵列(field programmable gate array,FPGA)器件,再调用ResNet-5... 为了解决嵌入式手势识别系统的速度慢和功耗高的问题,提出基于深度学习处理单元(deep-learning processor unit,DPU)的手势识别系统设计方法。通过把DPU部署于现场可编程门阵列(field programmable gate array,FPGA)器件,再调用ResNet-50网络对手势图片进行识别,设计并实现了一套低功耗的手势识别系统。实验结果表明,系统在工作频率为150 MHz时识别准确率为97.7%,运行速率可以达到129 GOPS,其能效比为26.3 GOPS/W,优于一些现有嵌入式FPGA神经网络手势识别实现方法。 展开更多
关键词 深度学习处理单元 手势识别 神经网络 现场可编程门阵列
下载PDF
基于网络处理器的防火墙集成虚拟专用网模块
17
作者 冯少少 傅予力 《系统工程与电子技术》 EI CSCD 北大核心 2008年第2期358-361,共4页
随着通信网络的发展,网络安全需求也趋于多样化,能够防御来自多技术层面安全威胁的网络设备显得越来越重要。集成了虚拟专用网(virtual private network,VPN)的网络防火墙是一种灵活、高效、可以实现多方位防御的网络安全设备。通过对In... 随着通信网络的发展,网络安全需求也趋于多样化,能够防御来自多技术层面安全威胁的网络设备显得越来越重要。集成了虚拟专用网(virtual private network,VPN)的网络防火墙是一种灵活、高效、可以实现多方位防御的网络安全设备。通过对Intel IXP2850网络处理器和它加/解密单元结构、功能、优点的分析,给出以该加/解密单元为解决方案的网络防火墙集成VPN模块的设计。 展开更多
关键词 防火墙 虚拟专业网 网络处理器 加/解密单元
下载PDF
基于鲲鹏云的复杂道路场景行人监测系统
18
作者 靳静玺 孙士杰 宋焕生 《计算机系统应用》 2022年第6期109-116,共8页
随着交通智能化的发展,高速公路监控视频加密上云逐渐成为交通发展的主要趋势之一.交通数据深度挖掘,尤其是行人检测问题,则是该趋势中亟待解决问题之一.本文针对多种道路环境的行人检测问题,提出了一种基于鲲鹏云的全天候行人监测解决... 随着交通智能化的发展,高速公路监控视频加密上云逐渐成为交通发展的主要趋势之一.交通数据深度挖掘,尤其是行人检测问题,则是该趋势中亟待解决问题之一.本文针对多种道路环境的行人检测问题,提出了一种基于鲲鹏云的全天候行人监测解决方案.首先,将监控相机中的视频流通过流媒体服务转发至鲲鹏云;然后鲲鹏云进行视频流解码与行人检测,同时保存行人历史信息;最后进行行人事件分析和上报.本系统采用嵌入式神经网络处理器(NPU)代替传统图形处理器(GPU)平台加速YOLOv4行人检测模块的推理,一方面取得了较快的检测速度并可实时处理22路视频流,另一方面,该解决方案针对不同道路场景下高速道路上的行人也可取得较好的监测效果. 展开更多
关键词 行人检测 npu 深度学习 YOLOv4 多目标检测
下载PDF
基于Vitis-AI架构的语义分割ENET模型实现 被引量:2
19
作者 胡凯 刘彤 +1 位作者 武亚恒 谢达 《电子与封装》 2022年第3期74-78,共5页
随着人工智能(Artificial Intelligence,AI)在自动驾驶和可穿戴等复杂环境中得到广泛应用,一种高效率的语义分割模型成为神经网络模型重要的解决对象。以传统ENET网络模型为基础,提出改进ENET网络,可利用深度学习处理单元(DPU)内部的EeL... 随着人工智能(Artificial Intelligence,AI)在自动驾驶和可穿戴等复杂环境中得到广泛应用,一种高效率的语义分割模型成为神经网络模型重要的解决对象。以传统ENET网络模型为基础,提出改进ENET网络,可利用深度学习处理单元(DPU)内部的EeLU激活函数硬件模式减少参数以改进ENET网络,提高DPU的工作性能。通过搭建语义分割的Vitis-AI架构平台,完成构建量化模型和模型网络的训练学习。对比分析多种语义分割试验结果,改进ENET网络,使用更少计算资源达到最优精度,在ZCU106的硬件平台上进行部署,对改进ENET网络的性能进行分析,结果表明试验结果和仿真结果一致。 展开更多
关键词 深度学习处理单元 ENET网络 语义分割
下载PDF
基于寄存器组的FFT处理器 被引量:1
20
作者 蔡梦 张科峰 +1 位作者 邹雪城 杨晓峰 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第1期55-57,68,共4页
针对目前快速傅里叶变换(FFT)处理器存储器访问算法复杂度较高,实现起来面积较大的问题,采用寄存器交换策略实现无冲突地址读写.以存储器迭代结构为主体构建FFT处理器结构,并设计了一种基于流水线的蝶形运算单元.根据基4蝶形运算数据选... 针对目前快速傅里叶变换(FFT)处理器存储器访问算法复杂度较高,实现起来面积较大的问题,采用寄存器交换策略实现无冲突地址读写.以存储器迭代结构为主体构建FFT处理器结构,并设计了一种基于流水线的蝶形运算单元.根据基4蝶形运算数据选择的规律性,采用数据移位操作可以去除存储器中的地址解码器和控制逻辑.采用门控时钟降低系统的功耗.设计的FFT处理器通过SMIC 0.18μm工艺综合仿真,其面积为0.6 mm2,整个处理过程只需要60个时钟周期.在20 MHz的工作频率下,系统的平均动态功耗为7mW.该结构可以满足IEEE 802.11a的要求,并且具有小面积及高效的特点. 展开更多
关键词 处理器 正交频分复用 快速傅里叶变换 存储器迭代 蝶形运算单元 无线局域网
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部