YUV空间中基于稀疏自动编码器的无监督特征学习被引量：16

Unsupervised Feature Learning with Sparse Autoencoders in YUV Space

下载PDF

导出

摘要现有无监督特征学习算法通常在RGB色彩空间进行特征提取,而图像和视频压缩编码标准则广泛采用YUV色彩空间。为了利用人类视觉特性和避免色彩空间转换所消耗的计算量,该文提出一种基于稀疏自动编码器在YUV色彩空间进行无监督特征学习的方法。首先在YUV空间随机采集图像子块并进行白化处理,然后利用稀疏自动编码器进行无监督局部特征学习。在预处理阶段,针对YUV空间亮度和色度通道相互独立的特性,提出一种将亮度和色度进行分离的白化措施。最后用学习到的局部特征在大尺寸图像上进行卷积操作从而获得全局特征,并送入图像分类系统进行性能测试。实验结果表明:只要对亮度分量进行适当的白化处理,在YUV空间中的无监督特征学习就能够获得相当于甚至优于RGB空间的彩色图像分类性能。 Existing unsupervised feature learning algorithms usually extract features in RGB color space, but YUV color space is widely adopted in image and video compression standards. In order to take advantage of human visual characteristics and avoid the calculation consumption caused by color space conversion, an unsupervised feature learning approach in YUV space based on sparse autoencoders is presented. First, image patches in YUV space are randomly sampled and whitened, and then are fed into sparse autoencoders to learn local features in an unsupervised way. Considering the characteristic that the luminance channel and chrominance channels are independent in YUV space, a whitening method which treats the luminance and chrominance separately is proposed in the pre-processing step. Finally, features learned over local image patches are convolved with large-size images in order to get global feature activations. Global features are then sent into image classification systems for performance testing. Experimental results reveal that unsupervised feature learning in YUV space achieves similar or even slightly better performance in color image classification compared with that in RGB space as long as the luminance component is whitened properly.

作者李祖贺樊养余王凤琴

机构地区西北工业大学电子信息学院郑州轻工业学院计算机与通信工程学院

出处《电子与信息学报》 EI CSCD 北大核心 2016年第1期29-37,共9页 Journal of Electronics & Information Technology

基金陕西省科技统筹创新工程重点实验室项目(2013SZS15-K02)~~

关键词图像分类无监督特征学习稀疏自动编码器卷积神经网络深度学习 Image classification Unsupervised feature learning Sparse Auto Encoder（SAE） Convolutional neural network Deep learning

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献23

1BENGIO Y, COURVILLE A, and VINCENT P. Representation learning: a review and new perspectives[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(8): 1798-1828.
2COATES A, NG A Y, and LEE H. An analysis of single-layer networks in unsupervised feature learning[C]. Preceedings of the 14th International Conference on Artificial Intelligence and Statistics, Ft. Lauderdale, 2011: 215-223.
3KRIZHEVSKY A, SUTSKEVER I, and HINTON G E. Imagenet classification with deep convolutional neural networks[C]. Preceedings of the 26th Annual Conference on Neural Information Processing Systems (NIPS), Lake Tahoe, 2012: 1097-1105.
4MASCI J, Meier U, CIREAN D, et al. Stacked convolutional auto-encoders for hierarchical feature extraction[C]. Preceedings of the 21st International Conference on Artificial Neural Networks, Espoo, 2011: 52-59.
5LI Z, FAN Y, and LIU W. The effect of whitening transformation on pooling operations in convolutional autoencoders[J]. EURASIP Journal on Advances in Signal Processing, 2015, 2015(1): 1-11.
6VINCENT P, LAROCHELLE H, Lajoie I, et al. Stacked denoising autoencoders: Learning useful representations in a deep network with a local denoising criterion[J]. The Journal of Machine Learning Research, 2010, 11(Dec): 3371-3408.
7YIN H, JIAO X, CHAI Y, et al. Scene classification based on single-layer SAE and SVM[J]. Expert Systems with Applications, 2015, 42(7): 3368-3380.
8ZHANG F, DU B, and ZHANG L. Saliency-guided unsupervised feature learning for scene classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2015, 53(4): 2175-2184.
9L?NGKVIST M and LOUTFI A. Learning feature representations with a cost-relevant sparse autoencoder[J]. International Journal of Neural Systems, 2015, 25(1): 1-11.
10LIU H L, Taniguchi T, TAKANO T, et al. Visualization of driving behavior using deep sparse autoencoder[C]. Preceedings of the 2014 IEEE Intelligent Vehicles Symposium, Dearborn, 2014: 1427-1434.

二级参考文献46

1任柯昱,唐丹,尹显东.基于字符结构知识的车牌汉字快速识别技术[J].计算机测量与控制,2005,13(6):592-594. 被引量：16
2胡昭华,樊鑫,梁德群,宋耀良.基于双向非线性学习的轨迹跟踪和识别[J].计算机学报,2007,30(8):1389-1397. 被引量：5
3Zhao Chumlin, Zheng chong-xun, Zhao Min, et al.. Multivariate autoregressive models and kernel learning algorithms for classifying driving mental fatigue based on electroencephalographic[J]. Expert Systems with Applications, 2011, 38(3): 1859-1865.
4Bengio Y and Delalleuu O. On the expressive power of deep architectures[J]. Lecture Notes in Computer Science, 2011, 6925: 18-36.
5Bengio Y. Deep learning of representations for unsupervised and transfer learning[C]. JMLR: Workshop and Conference Proceedings, Washington, USA, 2012, 27:17- 36.
6Yu D and Li D. Deep learning and its applications to signal and information processing[J]. IEEE Signal Processing Magazine, 2011, 28(1): 145-154.
7Vincent P, Larochelle H, Lajoie I, et al. Stacked denoising autoencoders: learning useful representations in a deep network with a local denoising criterion[J]. Journal of Machine Learning Research, 2010, 11( 2010): 3371-3408.
8Lee T, Mumford D, Romero R, et al.. The role of the primary visual cortex in higher level vision[J]. Vision Research, 1998, 38(15-16): 2429-2454.
9Wong W K and Sun M M. Deep learning regularized fisher mappingsIJ]. IEEE Transactions on Neural Networks, 2011, 22(10): 1668-1675.
10Yah S C, Xu D, Zhang B Y, et al.. Graph embedding and extensions: a general framework for dimensionality reduction [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(1): 40-51.

共引文献51

1何卫东,申佳红.基于SLE学习评价系统的深度学习初探[J].教育科学论坛,2020(22):75-77.
2赖俊森,杨爱英,孙雨南.基于眼图重构和人工神经网络的光性能监测[J].光电子．激光,2011,22(9):1342-1347. 被引量：3
3张贞凯,田雨波,周建江.基于改进广义回归神经网络和主成分分析的宽带DOA估计[J].光电子．激光,2012,23(4):692-696. 被引量：2
4刘云鹏,李瑾,潘闻.一种基于OpenCV的高效车牌识别系统实现[J].电子世界,2014(9):28-29. 被引量：3
5苑玮琦,金灿.基于结构特征的纸币号码识别方法[J].计算机工程与应用,2014,50(8):118-121. 被引量：9
6曲建岭,杜辰飞,邸亚洲,高峰,郭超然.深度自动编码器的研究与展望[J].计算机与现代化,2014(8):128-134. 被引量：41
7郭丽丽,丁世飞.深度学习研究进展[J].计算机科学,2015,42(5):28-33. 被引量：201
8李帅,许悦雷,马时平,倪嘉成,史鹤欢.一种深度神经网络SAR遮挡目标识别方法[J].西安电子科技大学学报,2015,42(3):154-160. 被引量：11
9王培良,夏春江.基于PCA-PDBNs的故障检测与自学习辨识[J].仪器仪表学报,2015,36(5):1147-1154. 被引量：21
10易万,罗晶,李勇,郭少英.基于自编码神经网络建立的搜索信息模型[J].计算技术与自动化,2015,34(2):117-121. 被引量：2

同被引文献120

1姜波,吴红,陈世锋,黄万里,林少霞,韩英杰.全自动血液分析仪异常报警信息的分析及临床应用[J].中华检验医学杂志,2006,29(11):1013-1016. 被引量：39
2官金安,陈亚光.相干平均单次提取脑-机接口信号[J].华中科技大学学报（自然科学版）,2007,35(1):11-13. 被引量：4
3李祥彬,李果,李学仁,李察.飞机舱音记录器背景声的联合时频分析研究[J].应用声学,2009,28(1):53-58. 被引量：1
4赵海滨,王宏.利用相对小波能量和概率网络的脑-机接口[J].计算机工程与应用,2009,45(5):26-28. 被引量：4
5王培良,葛志强,宋执环.基于迭代多模型ICA-SVDD的间歇过程故障在线监测[J].仪器仪表学报,2009,30(7):1347-1352. 被引量：12
6魏丹芳,李应.基于MFCC和加权动态特征组合的环境音分类[J].计算机与数字工程,2010,38(2):7-10. 被引量：4
7杨琳,王从庆,王芝刚,张红占.飞机舱音记录器非话语信号盲分离性能[J].南京航空航天大学学报,2010,42(2):185-190. 被引量：3
8陈洪波,李蓓蕾,陈真诚.基于ICA的脑电信号P300少次自动提取[J].电子学报,2012,40(6):1257-1262. 被引量：9
9张俊红,刘昱,毕凤荣,林杰威,马文朋,马梁.基于LMD和SVM的柴油机气门故障诊断[J].内燃机学报,2012,30(5):469-473. 被引量：18
10王国彪,何正嘉,陈雪峰,赖一楠.机械故障诊断基础研究“何去何从”[J].机械工程学报,2013,49(1):63-72. 被引量：284

引证文献16

1李勇.浅析色彩空间变换易被忽略的问题[J].昆明民族干部学院学报,2016,0(3):90-90.
2樊养余,李祖贺,王凤琴,马江涛.基于跨领域卷积稀疏自动编码器的抽象图像情绪性分类[J].电子与信息学报,2017,39(1):167-175. 被引量：4
3刘万军,梁雪剑,曲海成.自适应增强卷积神经网络图像识别[J].中国图象图形学报,2017,22(12):1723-1736. 被引量：27
4陈宇,温欣玲,刘兆瑜,马鹏阁.稀疏自动编码器视觉特征融合的多弹分类算法研究[J].红外与激光工程,2018,47(8):376-383. 被引量：4
5何沂,甘宇,逯宇佳,吕雪松,王曙煜.基于稀疏自编码的岩性识别方法[J].油气地球物理,2018,16(4):38-41.
6杨泽宇,王培良,叶晓丰.基于SSAE的非线性系统故障分类方法[J].控制工程,2018,25(11):2003-2009. 被引量：4
7赵瑞娟,官金安,谢国栋.稀疏降噪自编码器在IR-BCI的应用研究[J].计算机工程与应用,2017,53(11):167-171. 被引量：4
8傅桂霞,魏文辉,邹国锋,尹丽菊,高明亮.融合子区域局部二值模式特征与深层聚合网络的人脸识别[J].科学技术与工程,2018,18(19):237-243. 被引量：2
9张朝柱,黄妤宁.基于自编码器的飞机类型识别方法[J].无线电工程,2019,49(7):601-605. 被引量：1
10李晴晴,侯瑞春,丁香乾.基于改进堆叠自编码器的滚动轴承故障诊断[J].计算机工程与设计,2019,40(7):2064-2070. 被引量：23

二级引证文献94

1邱海锋,霍凯龙,尉耀稳,陈思超.移动互联网视频压缩技术设计研究[J].科技经济导刊,2020,0(1):46-46.
2陈志刚,宁伟红,杨彪,赵峰,陈泓.基于LORA通信的造纸厂粉尘浓度远程监测方法[J].造纸科学与技术,2022,41(6):23-27. 被引量：1
3于小青,马素霞,郑智聪.基于堆栈稀疏降噪自编码的电压暂降源识别方法[J].电力信息与通信技术,2018,16(11):47-52. 被引量：6
4宁海涛.非接触数字图像注入式红外目标分类识别仿真[J].计算机仿真,2018,35(12):376-379.
5贾文娟,张煜东.自编码器理论与方法综述[J].计算机系统应用,2018,27(5):1-9. 被引量：26
6程彬炜,安博文,赵明.基于卷积神经网络的遥感图像汽车识别[J].现代计算机（中旬刊）,2018(8):72-76.
7高述勇,周粉粉,符朝兴,孟含.卷积网络样本数和迭代数与识别结果关系研究[J].青岛大学学报（工程技术版）,2018,33(1):51-54.
8王勤勤,张玉红,李培培,胡学钢.基于word2vec的跨领域情感分类方法[J].计算机应用研究,2018,35(10):2924-2927. 被引量：14
9黄炜,黄建桥,李岳峰.一种基于稀疏自编码器的涉恐短文本特征提取方法[J].情报杂志,2019,38(3):203-206. 被引量：5
10徐少平,张贵珍,李崇禧,刘婷云,唐祎玲.基于深度置信网络的随机脉冲噪声快速检测算法[J].电子与信息学报,2019,41(5):1130-1136. 被引量：6

1张渤,张代林,陈幼平.用于无纺布缺陷检测的Gabor滤波器参数研究[J].武汉理工大学学报,2012,34(7):129-133. 被引量：7
2刘远军,高俊杰,朱鸿鹏,朱奕辉.一种基于YUV色彩空间的阴影检测方法[J].邵阳学院学报（自然科学版）,2010,7(4):17-21.
3濮永仙.基于支持向量机与多特征选择的农作物彩色病斑边缘检测[J].计算机系统应用,2014,23(9):118-123. 被引量：4
4李炜.一种结合YUV色彩空间和纹理的阴影检测[J].电脑知识与技术,2014,10(10X):7168-7169.
5周优,周长胜,张良,徐英慧.基于码本模型运动目标检测算法研究[J].工业控制计算机,2013(8):27-29.
6戴骊融,陈万米,郭盛.基于肤色模型和SURF算法的人脸识别研究[J].工业控制计算机,2014,27(2):48-50. 被引量：3
7丁健生.一种超大尺寸矢量图形的显示方法研究[J].才智,2010,0(30):56-57.
8邓波,徐庆,崔金鸽,李必云.基于DWT的图像分块压缩感知重构算法[J].吉首大学学报（自然科学版）,2016,37(5):27-31.
9马曾,赵时.基于PCA—ICA的盲源分离算法研究[J].电脑知识与技术,2007(11):791-793.
10曾志明,李峰,付琨,丁赤飚.一种大尺寸遥感图像基于内容检索的纹理特征提取算法[J].电子科学技术评论,2005(3):49-53.

电子与信息学报

2016年第1期

浏览历史

内容加载中请稍等...

YUV空间中基于稀疏自动编码器的无监督特征学习被引量：16

参考文献23

二级参考文献46

共引文献51

同被引文献120

引证文献16

二级引证文献94

相关作者

相关机构

相关主题

浏览历史

YUV空间中基于稀疏自动编码器的无监督特征学习 被引量：16

参考文献23

二级参考文献46

共引文献51

同被引文献120

引证文献16

二级引证文献94

相关作者

相关机构

相关主题

浏览历史

YUV空间中基于稀疏自动编码器的无监督特征学习被引量：16