基于卷积神经网络及易于硬件实现的真实图像去噪算法

Real image denoising algorithm based on convolutional neural network and easy hardware implementation

下载PDF

导出

摘要考虑移动端有限的计算资源,本文采用U型网络作为图像去噪的主干网络,提出了一种新的真实图像去噪算法CBDNet+.在CBDNet基础上,提出在上、下采样阶段采用小波变换,减少了乘法器的利用,更易于在资源有限的移动端实现,并且图像去噪性能较CBDNet有一定的提升.针对资源有限及低功耗的需求,对训练之后的网络进行剪枝以及8bit量化压缩,有效地提升了算法的效率并且减少了其需要的存储空间.在算法基础上,围绕硬件架构、片上缓存、性能及功耗等方面进行移动端专用型神经网络加速器的研究与设计.针对使用小波变换及小波逆变换的卷积神经网络图像去噪算法,采用专用的卷积神经网络加速器结构,降低片内外存储带宽;采用并行运算的方式,提高了小波逆变换的运算效率;在兼顾资源和速度的前提下,实现算法的加速推理.在AX7350 ZYNQ平台上实现了真实图像去噪系统,结果表明,本系统在100 MHz时钟下,平均计算性能为55.2 GOPS,功耗为1.93 W.图像去噪系统在DND测试集上测试,信噪比为36.21 dB,结构相似比为0.9435. Considering the limited computing resources of the mobile terminal,this paper adopts the U-shaped network as the backbone network of image denoising,and proposes a new real image denoising algorithm CBDNet+.On the basis of CBDNet,it is proposed to use wavelet transform in the up-sampling and down-sampling stages,which reduces the utilization of multipliers and is easier to implement on mobile terminals with limited resources,and the image denoising performance has a certain improvement compared with CBDNet.To meet the requirements of limited resources and low power consumption,the trained network is pruned and 8-bit quantized and compressed,which effectively improves the efficiency of the algorithm and reduces the required storage space.On the basis of the algorithm,the research and design of the mobile terminal-specific neural network accelerator are carried out in terms of hardware architecture,on-chip cache,performance and power consumption.For the convolutional neural network image denoising algorithm using wavelet transform and wavelet inverse transform,a dedicated convolutional neural network accelerator structure is used to reduce the storage bandwidth on and off the chip;the parallel operation is used to improve the operation efficiency of the wavelet inverse transform;Under the premise of taking into account resources and speed,the accelerated reasoning of the algorithm is realized.A real image denoising system is implemented on the AX7350 ZYNQ platform.The results show that the system has an average computing performance of 55.2 GOPS and a power consumption of 1.93 W under a clock of 100 MHz.The image denoising system is tested on the DND test set,the signal-to-noise ratio is 36.21 dB,and the structural similarity ratio is 0.9435.

作者李斌钮东吴朝晖徐会侯健达 LI Bin;NIU Dong;WU Zhaohui;XU Hui;HOU Jianda(School of Microelectronics,South China University of Technology,Zhuhai 510640,Guangzhou,China;Zhuhai Jieli Tech.Co.,LTD,Zhuhai 519060,Guangzhou,China)

机构地区华南理工大学微电子学院珠海市杰理科技股份有限公司

出处《微电子学与计算机》 2023年第2期87-93,共7页 Microelectronics & Computer

基金珠海市产学研合作项目:基于神经网络人工智能识别系统的研发(项目编号:ZH22017001200154PWC)。

关键词真实图像去噪卷积神经网络硬件加速 FPGA Real image denoising Convolutional neural network Hardware Accelerator FPGA

分类号 TN492 [电子电信—微电子学与固体电子学]

引文网络
相关文献

参考文献5

1翟社平,邱程,杨媛媛,李婧,江婷婷.基于FPGA的卷积神经网络加速器设计与实现[J].微电子学与计算机,2019,36(8):83-86. 被引量：9
2李炳辰,黄鲁.一种移动卷积神经网络的FPGA实现[J].微电子学与计算机,2019,36(9):7-11. 被引量：6
3武磊,魏子涵,张伟功,王晶,高岚.一种通用CNN加速器的缓冲区地址调度方法[J].微电子学与计算机,2020,37(7):82-86. 被引量：2
4王巍,周凯利,王伊昌,王广,杨正琳,袁军.卷积神经网络(CNN)算法的FPGA并行结构设计[J].微电子学与计算机,2019,36(4):57-62. 被引量：13
5王肖,邓军勇,谢晓燕.可重构卷积神经网络加速器设计与实现[J].传感器与微系统,2022,41(2):82-85. 被引量：6

二级参考文献8

1余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：596
2方睿,刘加贺,薛志辉,杨广文.卷积神经网络的FPGA并行加速方案设计[J].计算机工程与应用,2015,51(8):32-36. 被引量：27
3李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515. 被引量：544
4余子健,马德,严晓浪,沈君成.基于FPGA的卷积神经网络加速器[J].计算机工程,2017,43(1):109-114. 被引量：36
5卢冶,陈瑶,李涛,蔡瑞初,宫晓利.面向边缘计算的嵌入式FPGA卷积神经网络构建方法[J].计算机研究与发展,2018,55(3):551-562. 被引量：46
6王巍,周凯利,王伊昌,王广,杨正琳,袁军.卷积神经网络(CNN)算法的FPGA并行结构设计[J].微电子学与计算机,2019,36(4):57-62. 被引量：13
7方荣强,王晶,姚治成,刘畅,张伟功.多层神经网络算法的计算特征建模方法[J].计算机研究与发展,2019,56(6):1170-1181. 被引量：6
8翟社平,邱程,杨媛媛,李婧,江婷婷.基于FPGA的卷积神经网络加速器设计与实现[J].微电子学与计算机,2019,36(8):83-86. 被引量：9

共引文献27

1李莉,陈心宇,高文斌.一种基于FPGA的卷积神经网络加速器实现方案[J].北京电子科技学院学报,2022,30(4):96-104.
2陈卓,陈羿多,田春生,邱培熠,邸志雄.一种面向ZynqNet硬件加速器的缓存优化结构设计[J].微电子学,2023,53(5):841-845.
3周瑾,薛玉群,詹毅,蒋见花.一种语音编码算法的高吞吐率实现[J].微电子学与计算机,2020,37(3):9-13.
4武磊,魏子涵,张伟功,王晶,高岚.一种通用CNN加速器的缓冲区地址调度方法[J].微电子学与计算机,2020,37(7):82-86. 被引量：2
5尚尚,林思劼,郭伟新,丛丰裕.基于便携式计算设备的传统光学显微镜的AI赋能升级[J].中国医疗设备,2020,35(8):16-20.
6裴悦琨,谷宇,连明月.基于FPGA的快速樱桃缺陷检测与识别系统设计[J].食品与机械,2020,36(8):129-134. 被引量：4
7左国渭,应三丛.FPGA的可配置卷积运算单元的设计与实现[J].单片机与嵌入式系统应用,2020,20(11):54-58. 被引量：2
8张帆.图像卷积实时计算的FPGA实现[J].电子设计工程,2021,29(1):132-137. 被引量：3
9唐蕊,焦继业,徐华昊.面向嵌入式的卷积神经网络硬件加速器设计[J].计算机工程与应用,2021,57(4):252-257. 被引量：4
10程德怿,乔健.基于FPGA的vBRAS转发平面架构设计与实现[J].电信工程技术与标准化,2021,34(3):59-66.

1周联敏,周冬明,杨浩.结合迁移学习的真实图像去噪算法[J].科学技术与工程,2022,22(34):15237-15244. 被引量：1
2郭鹏星,刘志远,侯维刚,郭磊.相变材料辅助的光子卷积神经网络加速器[J].光学学报,2023,43(4):128-137. 被引量：1
3易图明,王先全,袁威,何晓冬.基于导向滤波和小波变换的红外可见光图像融合改进算法研究[J].现代信息科技,2023,7(6):41-45.
4池源,蒋俊正.一种空时信号的分布式在线重构算法[J].桂林电子科技大学学报,2023,43(2):128-134.
5唐超,石艳.带边缘增强的双树复小波阈值去噪方法[J].激光与光电子学进展,2023,60(4):315-322.
6吴亮,唐利明.基于重叠群稀疏分数阶全变分正则化模型的图像去噪算法[J].湖北民族大学学报（自然科学版）,2023,41(1):40-50. 被引量：1
7张伟萍,付民,张海燕,李欣.改进的WOA-VMD算法在水声信号去噪中的应用[J].中国海洋大学学报（自然科学版）,2023,53(1):138-146. 被引量：3
8王俊凯,张向利.基于FPGA的SDN中QoS保障算法的设计与实现[J].桂林电子科技大学学报,2023,43(1):14-19. 被引量：2
9顾牡丹,周辉奎.边缘增强的双密度双树复小波阈值滤波器[J].实验室研究与探索,2022,41(12):45-51.
10柳蕴洋,任崇阁,张治强.超高分段放矿体内部应力演化规律研究[J].矿业研究与开发,2023,43(3):32-38.

微电子学与计算机

2023年第2期

浏览历史

内容加载中请稍等...

基于卷积神经网络及易于硬件实现的真实图像去噪算法

参考文献5

二级参考文献8

共引文献27

相关作者

相关机构

相关主题

浏览历史