基于深度学习的手绘草图识别被引量：26

Sketch Recognition Using Deep Learning

下载PDF

导出

摘要现有的手绘草图识别方法严重依赖于费时费力的手工特征提取,而经典的深度学习模型主要是为彩色多纹理自然图像设计,用于识别手绘草图时效果不甚理想。提出一种基于深度学习的手绘草图识别方法(DeepSketch),该算法根据手绘草图缺失颜色、纹理信息的特点,使用大尺寸的首层卷积核取代自然图像识别中常使用的小尺寸首层卷积核,获得更多的空间结构信息。利用训练浅层模型获得的模型参数来初始化深层模型对应层的模型参数,以加快收敛,减少训练时长。加入不改变特征大小的卷积层来加深网络深度等方法以减小错误率。实验结果表明,所提出的方法较之其它几种主流的手绘草图识别方法具有良好的正确率,对250类手绘草图识别正确率达到69.2%。 In order to salve the existing problem of the sketch recognition heavily relying on the manual feature extraction which is very time-consuming, a method of sketch recognition based on deep leaming, called Deep-Sketch, was proposed. The classical deep learning models were mainly designed for natural color image recognition which failed on the sketch recognition. Deep-Sketch aimed to obtain more spatial structure information by using the large-size convolution kernel instead of the small-size convolution kernel in the first convolution layer. In addition, a shallow model was trained to obtain parameters which were used to initialize the corresponding layer parameters of the Deep-Sketch to reduce the model training time. Deep-Sketch was deepened with the convolution layers which kept the feature size to reduce the error rate. The results showed that the Deep-Sketch is superior to other state-of-the-art sketch recognition methods and achieves 69.2% accuracy on the sketch dataset including 250 classes.

作者赵鹏王斐刘慧婷姚晟

机构地区安徽大学计算智能与信号处理教育部重点实验室安徽大学计算机科学与技术学院

出处《四川大学学报（工程科学版）》 EI CAS CSCD 北大核心 2016年第3期94-99,共6页 Journal of Sichuan University (Engineering Science Edition)

基金国家自然科学基金资助项目(61472001 61202227) 安徽省自然科学基金项目(1408085MF122 1508085MF127) 安徽省高校自然科学研究重点项目(KJ2016A041) 安徽大学信息保障技术协同创新中心公开招标课题(ADXXBZ2014-5 ADXXBZ2014-6)

关键词手绘草图识别深度学习卷积神经网络 sketch recognition deep learning convolution neural network

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献24

1Eitz M,Hays J,Alexa M.How do humans sketch objects?[J].ACM Transactions on Graph,2012,31(4):44-54.
2Schneider R G,Tuytelaars T.Sketchclassification and clas- sification-driven analysis using fisher vectors[J].ACM Transactions on Graphics,2014,33(6):174-183.
3Sun Zhenbang,Wang Changhu,Zhang Liqing,et al.Free hand-drawn sketch segmentation[C]//Proceedings of the 12th European Conference on Computer Vision.Florence:Springer,2012:626-639.
4Hu Rui,Collomosse J.A performance evaluation of gradi- ent field hog descriptor for sketch based image retrieval[J].Computer Vision and Image Understanding,2013,117(7);790-806.
5Yasseen Z,Verroust-Blondet A,Nasri A.Sketch-based 3D object retrieval using two views and a visual part align- ment[J].The Eurographics Association,2015,3(15):39-46.
6Lowe D G.Distinctive image features from scale-invariant keypoints[J].International Journal of Computer Vision,2004,60(2):91-110.
7Li Yi,Hospedales T M,Song Yizhe,et al.Free-hand sketch recognition by multi-kernel feature learning[J],Computer Vision and Image Understanding,2015,137:1-11.
8Amanatiadis A,Kaburlasos V,Gasteratos A,et al.Evalua- tion of shape descriptors for shape-based image retrieval[J].IET Image Processing Journal,2011,5(5):493-499.
9Zhao Peng,Zhu Weiwei,Wu Xianwen,et al.Feature de- scription method for freehand sketch by combining entro- py and potential energy[J].Journal of South China Uni- versity of Technology:Natural Science Edition,2014,42(5):122-127.
10赵鹏,朱伟伟,吴献文,刘慧婷.融合熵和势能的手绘草图特征描述方法[J].华南理工大学学报（自然科学版）,2014,42(5):122-127. 被引量：4

二级参考文献23

1Mohamed A, Dahl G E, Hinton G. Acoustic modeling u- sing deep belief networks [ J ]. IEEE Transactions on Au- dio,Speech, and Language Processing,2012,20 ( 1 ) : 14 - 22.
2Deng L, Platt J C. Ensemble deep learning for speech recognition[ C]//Proceedings of the Annual Conference of International Speech Communication Association (INTER- SPEECH). Washington DC :IEEE,2014 : 1915 - 1919.
3Dahl G E, Yu D, Deng L, et al. Context-dependent pre- trained deep neural networks for large-vocabulary speech recognition[ J]. IEEE Transactions on Audio, Speech, and Language Processing,2012,20( 1 ) :30 -42.
4Du J, Dai L R, Huo Q. Synthesized stereo mapping via deep neural networks for noisy speech recognition [ C ]// 2014 IEEE International Conference on Acoustics,Speech and Signal Processing (ICASSP). Washington DC : IEEE, 2014 : 1764 - 1768.
5Lee H,Hu T,Jing H,et al. Ensemble of machine learning and acoustic segment model techniques for speech emo- tion and autism spectrum disorders recognition[ C]//Pro-ceedings of the Annual Conference of International Speech Communication Association ( INTERSPEECH ). Washington DC : IEEE ,2013:215 - 219.
6Xu Y,Mo T,Feng Q,et al. Deep learning of feature rep- resentation with multiple instance learning for medical im- age analysis[ C ]//Proceedings of IEEE International Con- ference on Acoustics, Speech and Signal Processing (IC- ASSP). Washington DC :IEEE,2014 : 1626 - 1630.
7Yan Y, Fanty M, Cole R. Speech recognition using neural networks with forward-backward probability generated tar- gets[C]//Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing. Washington DC : IEEE, 1997,4 : 3241 - 3241.
8Hennebert J, Ris C, Bourlard H, et al. Estimation of global posteriors and forward-backward training of hybrid HMM/ ANN systems [ C ]//Proceedings of European Conference Speech Communication and Technology. 1997:1951 -1954.
9Cosi P, Hosom J P, Valente A. High performance tele- phone bandwidth speaker independent continuous digit recognition[C]//Proceedings of IEEE Workshop on Auto- matic Speech Recognition and Understanding,2001 (AS- RU' 01 ). Washington DC : IEEE ,2001:405 - 408.
10Yah Y. Understanding speech recognition using correla- tion-generated neural network targets [ J ]. IEEE Transac- tions on,Speech and Audio Processing,1999,7(3):350- 352.

共引文献6

1龚永坚,宣翠仙,楼建忠,李强.基于数位笔压感的汽车三维手绘系统研究[J].农业机械学报,2015,46(8):314-318. 被引量：2
2宣翠仙,李强,龚永坚,楼建忠.基于数位笔压感的三维手绘笔触表达与深度转换[J].农业机械学报,2016,47(5):366-371. 被引量：5
3黄丽霞,王亚楠,张雪英,王洪翠.基于深度自编码网络语音识别噪声鲁棒性研究[J].计算机工程与应用,2017,53(13):49-54. 被引量：9
4孙林檀,唐博麟,田举,李子乾.基于语音识别的智能故障报修系统的研究与应用[J].电子科学技术,2017,4(5):73-76.
5陈高华,闫献国,郭宏,姚永超.压电陶瓷传感器的灵敏度温漂误差补偿研究[J].传感技术学报,2020,33(3):397-403. 被引量：6
6孟志刚,廖帅元.基于深度学习的手绘图形识别的研究[J].计算机与数字工程,2023,51(4):949-953.

同被引文献169

1石妍孜.探讨自然与建筑的关系——以安藤忠雄作品为例[J].美与时代（城市）,2020,0(1):12-13. 被引量：3
2蔡煜东,甘俊人,姚林声.人工神经网络在地震综合预报中的应用[J].地震学报,1993,15(2):257-260. 被引量：14
3黄志全,崔江利,刘汉东.边坡稳定性预测的混沌神经网络方法[J].岩石力学与工程学报,2004,23(22):3808-3812. 被引量：26
4尹建峰,孙正兴,邱庆华,蒋维.基于笔序的手绘草图识别方法[J].计算机科学,2005,32(1):198-201. 被引量：5
5冯夏庭,王泳嘉,卢世宗.边坡稳定性的神经网络估计[J].工程地质学报,1995,3(4):54-61. 被引量：115
6向超文,徐锦洪,李焜,於志斌.人工神经网络边坡稳定预报[J].苏州科技学院学报（工程技术版）,2006,19(2):21-25. 被引量：4
7显荣.近津飞鸟历史博物馆,大阪,日本[J].世界建筑,2003(6):92-93. 被引量：2
8周建新,戴永,王求真.智能像卡输入的手绘电气符号识别研究[J].计算机测量与控制,2006,14(12):1698-1699. 被引量：3
9赵新龙,方贵盛,沈莉芳.基于BP神经网络的草图编辑手势识别[J].浙江水利水电专科学校学报,2006,18(4):31-33. 被引量：1
10虞雪君.模糊数学方法在地震预测中的应用研究及其实效[J].国际地震动态,2006,27(12):20-23. 被引量：3

引证文献26

1章文彪.市委"三讲"办如何履行指导职责[J].理论学习（浙江）,2000(3):32-33.
2张董,游福成,王惠华,姜超,李明.受限制Boltzmann机深度置信网络与手写数字识别[J].北京印刷学院学报,2016,24(4):56-58. 被引量：4
3王玉豪,方贵盛.基于DAGSVM和决策树的电气草图符号识别[J].轻工机械,2017,35(4):56-59. 被引量：3
4陈晓杰,方贵盛.一种基于图元结构关系的电气草图符号识别方法[J].机电工程,2017,34(8):823-828. 被引量：3
5李勤,师维,孙界平,董超,曲天舒.基于卷积神经网络的网络流量识别技术研究[J].四川大学学报（自然科学版）,2017,54(5):959-964. 被引量：13
6郑宗生,郝剑波,黄冬梅,邹国良.基于深度学习的近岸海浪等级视频监测[J].海洋环境科学,2017,36(6):934-940. 被引量：6
7佘鹏,甘健侯,文斌,周菊香.经典深度卷积神经网络模型在手绘草图识别中的应用研究[J].云南师范大学学报（自然科学版）,2018,38(1):29-34. 被引量：6
8蔡润,武震,云欢,郭鹏.基于BP和SOM神经网络相结合的地震预测研究[J].四川大学学报（自然科学版）,2018,55(2):307-315. 被引量：17
9邹煜,刘兴旺.基于深度学习手写字符的特征抽取方法研究[J].软件,2017,38(1):23-28. 被引量：2
10臧欣慈,马帅.矢量图元素聚类的手绘图案绘制算法[J].科技通报,2017,33(7):129-132.

二级引证文献118

1华夏,王新晴,马昭烨,王东,邵发明.基于递归神经网络的视频多目标检测技术[J].计算机应用研究,2020,37(2):615-620. 被引量：7
2代志康,吴秋新,程希明.一种基于ResNet的网络流量识别方法[J].北京信息科技大学学报（自然科学版）,2020,35(1):82-88. 被引量：5
3肖韶节.衡阳市长的审计观[J].中国审计,2000(1):27-27.
4刘方园,王水花,张煜东.深度置信网络模型及应用研究综述[J].计算机工程与应用,2018,54(1):11-18. 被引量：49
5卿东升,李建军,邓巧玲.基于二进制的印刷体数字识别算法[J].计算机与网络,2018,44(5):62-64. 被引量：1
6刘钢,王慧,王新颖.基于改进的稀疏降噪自编码网络的三维模型识别方法[J].吉林大学学报（理学版）,2018,56(3):669-675. 被引量：2
7李怡轩.基于机器学习的手写数字识别系统设计与实现[J].微型电脑应用,2018,34(8):78-81. 被引量：4
8陈翔,唐俊勇.基于贝叶斯与因果岭回归的物联网流量预测模型[J].四川大学学报（自然科学版）,2018,55(5):965-970. 被引量：11
9万萌,冯新玲.基于无监督特征选择和卷积神经网络的图像识别算法[J].赤峰学院学报（自然科学版）,2018,34(10):52-55. 被引量：4
10龙彬,胡思才,郭峻铭,李旭伟.基于BP神经网络的网络小说排行预测[J].四川大学学报（自然科学版）,2019,56(1):50-56. 被引量：5

1尹建峰,孙正兴,邱庆华,蒋维.基于笔序的手绘草图识别方法[J].计算机科学,2005,32(1):198-201. 被引量：5
2金剑,常丹华.基于ARM的逻辑门电路手绘草图识别[J].计算机应用与软件,2013,30(10):293-296.
3王强,孙正兴,李曼舞,蒋维.手绘草图识别中的相关反馈方法[J].计算机科学,2005,32(2):224-228.
4杨晓峰,严建峰,刘晓升,杨璐.深度随机森林在离网预测中的应用[J].计算机科学,2016,43(6):208-213. 被引量：5
5姜全胜,廖达雄.基于用户建模的手绘草图识别[J].计算机仿真,2009,26(9):176-179. 被引量：3
6崔鹏,周兵,杨镇江.基于特征大小的背景差分算法研究[J].微计算机信息,2010,26(12):182-183. 被引量：1
7卢振坤.基于Gabor滤波和图像金字塔的多聚焦图像融合[J].梧州学院学报,2009,19(3):66-71.
8赵光权,葛强强,刘小勇,彭喜元.基于DBN的故障特征提取及诊断方法研究[J].仪器仪表学报,2016,37(9):1946-1953. 被引量：113
9尹邵龙,赵亚楠.深度学习在城市交通流预测中的实践研究[J].现代电子技术,2015,38(15):158-162. 被引量：14
10胡侯立,魏维,胡蒙娜.深度学习算法的原理及应用[J].信息技术,2015,39(2):175-177. 被引量：20

四川大学学报（工程科学版）

2016年第3期

浏览历史

内容加载中请稍等...

基于深度学习的手绘草图识别被引量：26

参考文献24

二级参考文献23

共引文献6

同被引文献169

引证文献26

二级引证文献118

相关作者

相关机构

相关主题

浏览历史

基于深度学习的手绘草图识别 被引量：26

参考文献24

二级参考文献23

共引文献6

同被引文献169

引证文献26

二级引证文献118

相关作者

相关机构

相关主题

浏览历史

基于深度学习的手绘草图识别被引量：26