期刊文献+
共找到111篇文章
< 1 2 6 >
每页显示 20 50 100
CMOS low-dropout regulator with 3.3 μA quiescent current without off-chip capacitor
1
作者 王忆 崔传荣 +1 位作者 巩文超 何乐年 《Journal of Southeast University(English Edition)》 EI CAS 2009年第1期13-17,共5页
A CMOS (complementary metal-oxide-semiconductor transistor) low-dropout regulator (LDO) with 3. 3 V output voltage and 100 mA output current for system-on-chip applications to reduce board space and external pins ... A CMOS (complementary metal-oxide-semiconductor transistor) low-dropout regulator (LDO) with 3. 3 V output voltage and 100 mA output current for system-on-chip applications to reduce board space and external pins is presented. By utilizing a dynamic slew-rate enhancement(SRE) circuit and nested Miller compensation (NMC) on the LDO structure, the proposed LDO provides high stability during line and load regulation without off-chip load capacitors. The overshot voltage is limited within 550 mV and the settling time is less than 50 μs when the load current decreases from 100 mA to 1 mA. By using a 30 nA reference current, the quiescent current is 3.3 μA. The proposed design is implemented by CSMC 0. 5 μm mixed-signal process. The experimental results agree with the simulation results. 展开更多
关键词 low-dropout regulator off-chip capacitor slew-rate enhancement circuit nested Miller compensation(NMC)
下载PDF
Pulse coding off-chip learning algorithm for memristive artificial neural network
2
作者 Ming-Jian Guo Shu-Kai Duan Li-Dan Wang 《Chinese Physics B》 SCIE EI CAS CSCD 2022年第7期648-656,共9页
Memristive neural network has attracted tremendous attention since the memristor array can perform parallel multiplyaccumulate calculation(MAC)operations and memory-computation operations as compared with digital CMOS... Memristive neural network has attracted tremendous attention since the memristor array can perform parallel multiplyaccumulate calculation(MAC)operations and memory-computation operations as compared with digital CMOS hardware systems.However,owing to the variability of the memristor,the implementation of high-precision neural network in memristive computation units is still difficult.Existing learning algorithms for memristive artificial neural network(ANN)is unable to achieve the performance comparable to high-precision by using CMOS-based system.Here,we propose an algorithm based on off-chip learning for memristive ANN in low precision.Training the ANN in the high-precision in digital CPUs and then quantifying the weight of the network to low precision,the quantified weights are mapped to the memristor arrays based on VTEAM model through using the pulse coding weight-mapping rule.In this work,we execute the inference of trained 5-layers convolution neural network on the memristor arrays and achieve an accuracy close to the inference in the case of high precision(64-bit).Compared with other algorithms-based off-chip learning,the algorithm proposed in the present study can easily implement the mapping process and less influence of the device variability.Our result provides an effective approach to implementing the ANN on the memristive hardware platform. 展开更多
关键词 off-chip learning mapping memristor array artificial neural network
下载PDF
Improving the Off-chip Bandwidth Utilization of Chip-Multiprocessors Using Early Write-Back
3
作者 Mutaz A1-Tarawneh NazeihBotros 《通讯和计算机(中英文版)》 2013年第1期33-41,共9页
关键词 带宽利用率 多处理器 早期 芯片 二级高速缓存 需求获取 层次结构 主存储器
下载PDF
压接型IGBT芯片的参数分散性对其并联时关断均流的影响
4
作者 曹子楷 崔翔 +4 位作者 代安琪 李学宝 范迦羽 詹雍凡 唐新灵 《中国电机工程学报》 EI CSCD 北大核心 2024年第5期1913-1923,I0021,共12页
压接型绝缘栅双极晶体管(insulated gate bipolar transistor,IGBT)的多芯片并联关断期间会出现严重的不均流现象,直接影响到器件的关断可靠性。文中重点研究压接型IGBT芯片参数对其并联时关断均流的影响,首先,根据IGBT单芯片的关断机... 压接型绝缘栅双极晶体管(insulated gate bipolar transistor,IGBT)的多芯片并联关断期间会出现严重的不均流现象,直接影响到器件的关断可靠性。文中重点研究压接型IGBT芯片参数对其并联时关断均流的影响,首先,根据IGBT单芯片的关断机理和波形,分析芯片参数对IGBT单芯片关断各个阶段内集电极电流变化的影响规律;其次,定义多芯片并联关断波形中出现的第一类及第二类电流竞争峰谷,建立针对第一类电流竞争峰谷的随机分布模型,获得芯片参数以及并联数目对关断均流的影响规律,通过并联双芯片的双脉冲实验,验证所得规律的有效性;最后,结合分析结果提出阈值电压与饱和压降的相互补偿以及保持阈值电压差与跨导差异号等芯片筛选建议。研究成果可以为并联压接型IGBT芯片的参数筛选工作提供指导。 展开更多
关键词 压接型绝缘栅双极晶体管 关断均流 芯片参数 筛选建议
下载PDF
基于单片机的中波广播应急音频切换器设计 被引量:1
5
作者 胡婷 何志勇 《广播与电视技术》 2024年第2期88-92,共5页
音频切换器作为重要的信号源链路设备,在广播播出系统中应用广泛。本文设计了一种基于单片机技术的信号源应急音频切换器,包括单片机电路、音频选通电路、信号源检测判断电路、指示灯电路、按键电路、信号断电保障电路等。在手动模式下... 音频切换器作为重要的信号源链路设备,在广播播出系统中应用广泛。本文设计了一种基于单片机技术的信号源应急音频切换器,包括单片机电路、音频选通电路、信号源检测判断电路、指示灯电路、按键电路、信号断电保障电路等。在手动模式下,用户可通过按键选择所需的信号源输出;在自动模式下,设备则根据预设的优先级自动选择信号源输出。此外,当所有信号源中断时,设备会自动进入报警状态。在设备断电的情况下,作为信号源应急装置,该切换器能够确保主信号源的持续输出,从而有效避免停播现象,为广播电视信号的安全、优质播出提供了有力保障。 展开更多
关键词 音频切换器 单片机 应急 断电保障
下载PDF
一种低功耗无片外电容低压差线性稳压器设计 被引量:1
6
作者 任建 袁申 +1 位作者 辛晓宁 姜龙 《微处理机》 2023年第2期1-4,共4页
为降低LDO稳压器在芯片中的占用面积、减小待机状态下的电流消耗,设计一种低功耗、无片外电容的新型LDO。设计中采用动态电流偏置电路以及全新的电流负反馈型电压驱动电路,来提高LDO线性调整率。通过实验与其他设计方案对比,观察在一定... 为降低LDO稳压器在芯片中的占用面积、减小待机状态下的电流消耗,设计一种低功耗、无片外电容的新型LDO。设计中采用动态电流偏置电路以及全新的电流负反馈型电压驱动电路,来提高LDO线性调整率。通过实验与其他设计方案对比,观察在一定输入电压、输出电压条件下,负载电流变化对最大上冲电压、下冲电压的影响。新设计LDO在空载条件下消耗的电流为3.13μA,在降低功耗同时提高了过充电压抑制能力,有着明显的产品优势,低功耗应用前景广阔。 展开更多
关键词 低压差线性稳压器 无片外电容 线性调整率 动态置偏 低功耗
下载PDF
一种快速瞬态响应的LDO设计 被引量:1
7
作者 孙力 王志亮 +2 位作者 杨雨辰 谭庶欣 陈靖 《半导体技术》 CAS 北大核心 2023年第8期690-698,共9页
针对传统低压差线性稳压器(LDO)的瞬态响应差、电源抑制比(PSRR)低、片外电容大等问题,提出了一种由采样运算放大器和补偿运算放大器构成的新型摆率增强电路,改善了LDO的瞬态响应能力,实现了无片外电容设计。电路基于BCD-120 V CMOS工... 针对传统低压差线性稳压器(LDO)的瞬态响应差、电源抑制比(PSRR)低、片外电容大等问题,提出了一种由采样运算放大器和补偿运算放大器构成的新型摆率增强电路,改善了LDO的瞬态响应能力,实现了无片外电容设计。电路基于BCD-120 V CMOS工艺完成了建模。仿真结果显示,负载电流为50 mA时,10、103和104Hz下的PSRR分别为108、96和80 dB;负载调整率为0.002 95 V·A^(-1);典型TT工艺角25℃/5 V条件下,1μs内负载电流从100μA跳变到500 mA,输出端上冲电压为19.16 mV,响应时间为0.4μs,下冲电压为56.41 mV,响应时间为0.2μs。 展开更多
关键词 低压差线性稳压器(LDO) 瞬态响应 电源抑制比(PSRR) 无片外电容 摆率增强
下载PDF
一种基于CLASS-AB类运放的无片外电容LDO设计 被引量:1
8
作者 崔明辉 王星 +2 位作者 李娜 相立峰 张国贤 《电子技术应用》 2023年第9期53-57,共5页
介绍了一种基于CLASS-AB类运放无片外电容的低压差线性稳压器(LDO)。电路在高摆率误差放大器(EA)的基础上,通过构建动态偏置电路反馈到EA内部动态偏置管,大幅改善了LDO的瞬态响应能力,且动态偏置电路引入的左半平面零点保证了LDO的环路... 介绍了一种基于CLASS-AB类运放无片外电容的低压差线性稳压器(LDO)。电路在高摆率误差放大器(EA)的基础上,通过构建动态偏置电路反馈到EA内部动态偏置管,大幅改善了LDO的瞬态响应能力,且动态偏置电路引入的左半平面零点保证了LDO的环路稳定性。同时,EA采用过冲检测电路减小了输出过冲,缩短了环路稳定时间。电路基于65 nm CMOS工艺设计和仿真。仿真结果表明,在负载电流10μA~50 mA、输出电容0~50 pF条件下,LDO输出稳定无振荡。在LDO输入2.5 V、输出1.2 V、无片外电容条件下,控制负载在10μA和50 mA间跳变,LDO输出恢复时间为0.7μs和0.8μs,下冲和上冲电压为58 mV和15 mV。 展开更多
关键词 低压差线性稳压器 瞬态增强电路 动态偏置电路 无片外电容
下载PDF
芯片间时间触发消息堆叠调度方法
9
作者 臧光界 李峭 +1 位作者 王彤 熊华钢 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第7期1838-1846,共9页
时间触发(TT)通信方式应用于芯片间互连网络,以保证航空电子通信任务之间消息传递的严格时间确定性。当航空电子任务具有多种操作模式,属于不同模式的芯片间的时间触发调度表会重叠占用时隙,提出芯片间时间触发消息堆叠调度方法,以提高... 时间触发(TT)通信方式应用于芯片间互连网络,以保证航空电子通信任务之间消息传递的严格时间确定性。当航空电子任务具有多种操作模式,属于不同模式的芯片间的时间触发调度表会重叠占用时隙,提出芯片间时间触发消息堆叠调度方法,以提高利用网络资源的灵活性和效率,同时减小应用层消息由于等待时间触发时间窗的排队延迟。仿真实验表明:与超调度方法相比,所提方法能够减小芯片间互连网络中时间触发消息的总端到端延迟和链路平均时隙占用率,对于端到端延迟时间较长且链路平均承载消息传输较多的场景,采用所提方法减少端到端延迟的效果更显著。 展开更多
关键词 芯片间互连 时间触发消息 操作模式 堆叠调度 端到端延迟
下载PDF
面向片外不可信内存的一种实用ORAM方案
10
作者 濮传威 张功萱 +1 位作者 周俊龙 付安民 《信息安全研究》 CSCD 2023年第3期280-290,共11页
目前,大多数计算机系统都面临信息泄露的问题.在物理层面上,处理器芯片和片外不可信内存之间的总线是造成信息泄露的一个安全隐患,攻击者可以窥探内存总线上的数据以及地址,从而获得敏感信息.单独使用数据加密已经不足以保证系统的安全... 目前,大多数计算机系统都面临信息泄露的问题.在物理层面上,处理器芯片和片外不可信内存之间的总线是造成信息泄露的一个安全隐患,攻击者可以窥探内存总线上的数据以及地址,从而获得敏感信息.单独使用数据加密已经不足以保证系统的安全,因为每次内存访问仍然需要明文内存地址.攻击者仍然可以通过总线窥探每次内存访问的地址从而获得隐式信息.解决此问题的可能方法是使用不经意随机访问机(oblivious random access machine,ORAM)方案隐藏访问模式.但是现有的ORAM方案对于每次真实内存访问都涉及大量虚拟访问,明显增加了性能开销.提出了一种分组ORAM方案,该方案将真实内存访问隐藏在指定数量的一小簇虚拟访问中.其性能开销不会随着内存容量增加而增加,且该方案采用了参数化的设计,针对不同平台对安全性以及性能的要求,可以进行灵活配置.通过在Xilinx xc7vx330tFPGA平台上的实验表明,对于1次内存访问,与最先进的Tiny ORAM方案相比,分组ORAM可以显著减少性能开销. 展开更多
关键词 不经意随机访问机 低性能开销 片外不可信内存 安全处理器 隐私
下载PDF
一种正激变换器的输出过流保护电路
11
作者 唐天缘 罗萍 +3 位作者 杨健 冯冠儒 王壮壮 李成鑫 《微电子学》 CAS 北大核心 2023年第6期1085-1090,共6页
设计了一种适用于有源箝位正激变换器的输出过流保护电路。通过分析峰值电流模下正激变换器的反馈与控制原理,实现了过流保护电路可控制正激系统在五种不同工作模式下切换。该技术通过调节片外电阻R_(CS),实现可编程过流阈值自主设定。... 设计了一种适用于有源箝位正激变换器的输出过流保护电路。通过分析峰值电流模下正激变换器的反馈与控制原理,实现了过流保护电路可控制正激系统在五种不同工作模式下切换。该技术通过调节片外电阻R_(CS),实现可编程过流阈值自主设定。同时通过调节片外电容C_(RES),实现可编程过流时域响应快慢。该电路基于0.18μm BCD工艺进行了仿真与流片测试,实际测试结果表明,系统发生过流时,可以实现良好的过流保护功能。 展开更多
关键词 输出过流保护 有源箝位 正激变换器 片外可编程
下载PDF
一种快速瞬态响应的无片外电容型LDO电路设计 被引量:1
12
作者 李娜 陆峰 崔明辉 《微电子学与计算机》 2023年第8期94-100,共7页
本文基于SMIC65 nm工艺,设计了一款快速瞬态响应的无片外电容型低压差线性稳压器(low dropout regulator,LDO).采用高增益跨导结构(OTA)的误差放大器,利用局部共模反馈结构(CFRFC),增加了放大器跨导率,提高了放大器的直流增益.同时,引... 本文基于SMIC65 nm工艺,设计了一款快速瞬态响应的无片外电容型低压差线性稳压器(low dropout regulator,LDO).采用高增益跨导结构(OTA)的误差放大器,利用局部共模反馈结构(CFRFC),增加了放大器跨导率,提高了放大器的直流增益.同时,引入一个由电容耦合电流镜构成的瞬态检测电路,取代了传统LDO电路中的大电容,便于检测输出的跳变,增大对功率管的充放电能力,提高了环路瞬态响应速度,降低LDO环路的上/下冲电压.缓冲级采用了带电压负反馈的源级跟随器,在一定的静态功耗下,提高了动态电流,将次级点推到更高的频率,提高了电路相位裕度.仿真结果表明,输入电压为2~3 V时,该电路输出为1.2 V,最大负载电流为100 mA;当负载电流在0~100 mA时,LDO输出的最大过冲电压和欠冲电压为23 mV和27 mV,并且在低频时有较高的电源抑制比. 展开更多
关键词 无片外电容 瞬态增强 源级跟随器 LDO
下载PDF
无片外电容LDO的补偿方法研究
13
作者 李天硕 李严 刘莹 《微处理机》 2023年第5期9-12,共4页
无片外电容LDO器件无法通过片外电容提供频率补偿和瞬态稳压,为了弥补由此带来的器件在稳定性和瞬态特性上的缺陷,需要额外设计补偿电路。研究选用普通源极跟随器作为一种结构简单的缓冲器,作为补偿手段,以提高无片外电容LDO的功能表现... 无片外电容LDO器件无法通过片外电容提供频率补偿和瞬态稳压,为了弥补由此带来的器件在稳定性和瞬态特性上的缺陷,需要额外设计补偿电路。研究选用普通源极跟随器作为一种结构简单的缓冲器,作为补偿手段,以提高无片外电容LDO的功能表现。补偿电路通过SMIC 0.18μm CMOS工艺实现,基于对普通源极跟随器的特性的理论分析,进一步设计出超级源极跟随器。通过理论分析与电路仿真,综合研究了无缓冲器、普通源极跟随器、超级源极跟随器三种情况对LDO特性的影响。 展开更多
关键词 无片外电容LDO 瞬态特性 普通源极跟随器 超级源极跟随器
下载PDF
一种数据存储SoC芯片的静态时序约束设计
14
作者 王涛 赵启林 《单片机与嵌入式系统应用》 2023年第8期8-10,14,共4页
静态时序分析主要依赖于时序模型和时序约束,是数字芯片时序验证的重要方法,其中时序约束是用来描述设计人员对时序的要求,如时钟频率、输入/输出延迟等。正确的时序约束可以缩短芯片设计周期,更快更好地完成静态时序分析。针对一款数... 静态时序分析主要依赖于时序模型和时序约束,是数字芯片时序验证的重要方法,其中时序约束是用来描述设计人员对时序的要求,如时钟频率、输入/输出延迟等。正确的时序约束可以缩短芯片设计周期,更快更好地完成静态时序分析。针对一款数据存储SoC芯片中的多时钟域异步设计要求,以及如何正确处理时序约束存在的问题,提出一种多分组异步时钟的全芯片时序约束,采用虚假路径、多时钟域分组、禁用单个寄存器多时钟分析设置等方法修复和优化设计规则、建立时间和保持时间违例,解决SoC存储芯片静态时序分析中的时序问题,保证所有时序路径正常满足时序逻辑功能要求,完成时序收敛,达到签核标准。 展开更多
关键词 静态时序分析 时序约束 SOC芯片 时序收敛
下载PDF
超低功耗无片外电容的低压差线性稳压器 被引量:10
15
作者 陈琛 孙可旭 +2 位作者 冯建宇 奚剑雄 何乐年 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2017年第8期1669-1675,共7页
为了减小无片外电容低压差线性稳压器(LDO)的功耗并提高稳定性,提出带有阻抗衰减缓冲器的LDO.该LDO主环路采用三级运放结构,具有动态偏置并联反馈结构和摆率增强电路的缓冲器作为中间级,驱动PMOS功率管.使用嵌套密勒补偿方式(NMC),将低... 为了减小无片外电容低压差线性稳压器(LDO)的功耗并提高稳定性,提出带有阻抗衰减缓冲器的LDO.该LDO主环路采用三级运放结构,具有动态偏置并联反馈结构和摆率增强电路的缓冲器作为中间级,驱动PMOS功率管.使用嵌套密勒补偿方式(NMC),将低频主极点放置在第一级输出,将缓冲器输出极点和LDO输出极点作为次极点构成极点-极点追踪,达到无片外电容LDO稳定性和瞬态响应的要求.芯片采用GSMC公司的130nm CMOC工艺模型设计并经流片测试.测试结果表明:在1.6~4V输入电压下,输出1.5V电压,最大输出电流为1.5mA时静态电流小于881nA.测试结果验证了设计要求. 展开更多
关键词 低压差线性稳压器 超低功耗 无片外电容 嵌套密勒补偿(NMC) 阻抗衰减缓冲器
下载PDF
嵌入式处理器片外访存加密机制设计与实现 被引量:4
16
作者 刘根贤 王海霞 +1 位作者 刘振宇 汪东升 《计算机工程与应用》 CSCD 2014年第22期92-96,共5页
高安全敏感领域的嵌入式系统面临总线监听、数据篡改、离线分析等类型的恶意攻击,试图窃取密码、篡改信息等。特别是配合硬件电路的攻击,给用户造成重大的损失。为了从根本上解决系统外部电路系统攻击威胁,提出片外访存加密认证机制,选... 高安全敏感领域的嵌入式系统面临总线监听、数据篡改、离线分析等类型的恶意攻击,试图窃取密码、篡改信息等。特别是配合硬件电路的攻击,给用户造成重大的损失。为了从根本上解决系统外部电路系统攻击威胁,提出片外访存加密认证机制,选择AES-GCM算法,对所有片外写数据进行加密,对读数据进行解密并认证。同时设计一次密码与页地址置乱函数产生二次密钥,保障了加密强度。进一步通过软件实现LRU Cache优化性能,在STM32系列微处理器硬件平台上,软件实现片外访存加密认证机制。在内存压力测试中,加密片外访存性能平均降低了9%。 展开更多
关键词 嵌入式 微处理器 片外访存 加密认证
下载PDF
微构件力学性能片外拉伸测试装置 被引量:4
17
作者 沈洪源 褚金奎 +1 位作者 张段芹 罗汝林 《传感器与微系统》 CSCD 北大核心 2007年第7期99-101,110,共4页
微构件材料力学性能测试中,拉伸测试主要解决材料弹性模量、泊松比、屈服强度和断裂强度的测量问题。介绍了一种片外拉伸测试试验装置的设计过程及工作原理,试样放在动/静载物台上,压电陶瓷制动器驱动动载物台,从而拉动试样,直到试样被... 微构件材料力学性能测试中,拉伸测试主要解决材料弹性模量、泊松比、屈服强度和断裂强度的测量问题。介绍了一种片外拉伸测试试验装置的设计过程及工作原理,试样放在动/静载物台上,压电陶瓷制动器驱动动载物台,从而拉动试样,直到试样被拉断。施加在试样上的力和试样被拉伸后的伸长量分别由微力检测传感器和位移检测传感器测出。分别介绍了每个部件的功能,给出了误差分析。结果表明:此装置设计合理,达到预期目标。 展开更多
关键词 微构件 力学性能 拉伸测试 片外试验装置
下载PDF
A 12~18GHz Wide Band VCO Based on Quasi-MMIC
18
作者 王绍东 高学邦 +2 位作者 吴洪江 王向玮 默立冬 《Journal of Semiconductors》 EI CAS CSCD 北大核心 2008年第1期63-68,共6页
Using an in-house MMIC and an off-chip,high-quality varactor, a novel wide band VCO covered Ku band is introduced. In contrast to HMIC technology, this method reduces the complexity of microchip assembly. More importa... Using an in-house MMIC and an off-chip,high-quality varactor, a novel wide band VCO covered Ku band is introduced. In contrast to HMIC technology, this method reduces the complexity of microchip assembly. More importantly,it overcomes the constraint that the standard commercial GaAs pHEMT MMIC process is usually not compatible with highquality varactors for VCO,and it significantly improves the phase noise and frequency tuning linearity performances compared to either MMIC or HMIC implementation. It is a novel and high-quality method to develop microwave and millimeter wave VCO. 展开更多
关键词 MMIC WIDE-BAND VCO Ku band off-chip varactor bond-wire inductor
下载PDF
高稳定性高瞬态响应无片外电容LDO的设计 被引量:2
19
作者 谢海情 肖正 +3 位作者 唐俊龙 周斌腾 曾承伟 陈希贤 《半导体技术》 CAS CSCD 北大核心 2016年第6期416-420,共5页
基于Nuvoton 0.5μm 5 V标准CMOS工艺,设计了一种高稳定性、高瞬态响应、无片外电容低压差线性稳压器(LDO)。电路中引入了过冲、欠冲电压改善模块,用来削减过/欠充电压,互不干扰。过冲电压改善电路将LDO输出电压与参考电压进行比较,过... 基于Nuvoton 0.5μm 5 V标准CMOS工艺,设计了一种高稳定性、高瞬态响应、无片外电容低压差线性稳压器(LDO)。电路中引入了过冲、欠冲电压改善模块,用来削减过/欠充电压,互不干扰。过冲电压改善电路将LDO输出电压与参考电压进行比较,过冲状态下开启从LDO输出端到地的快速放电通路,欠冲电压改善电路通过电容耦合获得反映LDO输出电压瞬态变化的采样信号,经反向放大后加速功率管栅极电容放电,进而通过功率管对LDO输出电容充电。仿真结果表明,在TT工艺角下该低压差线性稳压器的空载相位裕度为64.57°,满载相位裕度为62.58°,过冲电压为40 m V,欠冲电压为97.6 m V,线性调整率为0.733‰;负载调整率19μV/m A;电源电压抑制比(PSRR)为-73 d B。 展开更多
关键词 稳定性 瞬态响应 低压差线性稳压器 无片外电容 瞬态增强电路
下载PDF
卷积神经网络训练访存优化 被引量:3
20
作者 王吉军 郝子宇 李宏亮 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2020年第2期98-107,共10页
虽然批归一化算法能有效加速深度卷积网络模型的收敛速度,但其数据依赖性复杂,训练时会导致严重的“存储墙”瓶颈。故对使用批归一化算法的卷积神经网络,提出多层融合且重构批归一化层的训练方法,减少模型训练过程中的访存量。首先,通... 虽然批归一化算法能有效加速深度卷积网络模型的收敛速度,但其数据依赖性复杂,训练时会导致严重的“存储墙”瓶颈。故对使用批归一化算法的卷积神经网络,提出多层融合且重构批归一化层的训练方法,减少模型训练过程中的访存量。首先,通过分析训练时批归一化层的数据依赖、访存特征及模型训练时的访存特征,分析访存瓶颈的关键因素;其次,使用“计算换访存”思想,提出融合“卷积层+批归一化层+激活层”结构的方法,并基于批归一化层的计算访存特征,将其重构为两个子层,分别与相邻层融合,进一步减少训练时对主存的读写,并构建了训练时的访存量模型与计算量模型。实验结果表明,使用NVIDIA TESLA V100 GPU训练ResNet-50、Inception V3及DenseNet模型时,同原始训练方法相比,其访存数据量分别降低了33%,22%及31%,V100的实际计算效率分别提升了20.5%,18.5%以及18.1%。这种优化方法利用了网络结构与模型训练时的访存特点,可与其他访存优化方法协同使用,进一步降低模型训练时的访存量。 展开更多
关键词 深度卷积神经网络 模型训练 多层融合 批归一化重构 访存优化
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部