基于多视图特征投影与合成解析字典学习的图像分类被引量：1

Multi-view feature projection and synthesis-analysis dictionary learning for image classification

下载PDF

导出

摘要针对目前存在的合成解析字典学习方法不能有效地消除同类样本之间的差异性和忽略了不同特征对分类的不同影响的问题,提出了一种基于多视图特征投影与合成解析字典学习(MFPSDL)的图像分类方法。首先,在合成解析字典学习过程中为每种特征学习不同的特征投影矩阵,减小了类内样本间的差异对识别带来的影响;其次,对合成解析字典添加鉴别性的约束,使得同类样本具有相似的稀疏表示系数;最后通过为不同类型的特征学习权重,充分地融合多种特征。在公开人脸数据库(LFW)和手写体识别数据库(MNIST)上进行多项对比实验,MFPSDL方法在LFW和MNIST数据库上的训练时间分别为61.236 s和52.281 s,MFPSDL方法相比Fisher鉴别字典学习(FDDL)、类别一致的K奇异值分解(LC-KSVD)、字典对学习(DPL)等字典学习方法,在LFW和MNIST上的识别率提高了至少2.15和2.08个百分点。实验结果表明,所提方法在保证较低的时间复杂度的同时,获得了更好的识别效果,适用于图像分类。 Concerning the problem that the existing synthesis-analysis dictionary learning method can not effectively eliminate the differences between the samples of the same class and ignore the different effects of different features on the classification, an image classification method based on Multi-view Feature Projection and Synthesis-analysis Dictionary Learning （MFPSDL） was put forward. Firstly, different feature projection matrices were learned for different features in the process of synthesis-analysis dictionary learning, so the influence of the within-class differences on recognition was reduced. Secondly, discriminant constraint was added to the synthesis-analysis dictionary, so that similar sparse representation coefficients were obtained for samples of the same class. Finally, by learning different weights for different features, multiple features could be fully integrated. Several experiments were carried out on the Labeled Faces in the Wild （LFW） and Modified National Institute of Standards and Technology （MNIST） database, the training time of MFPSDL method on LFW and MNIST databases were 61. 236 s and 52. 281 ,~. Compared with Fisher Discrimination Dictionary Learning （ FDDL）, Lable Consistent K Singular Value Decomposition （LC-KSVD） and Dictionary Pair Learning （ DPL）, the recognition rate of MFPSDL method on LFW and MNIST was increased by at least 2.15 and 2.08 percentage points. The experimental results show that MFPSDL method can obtain higher recognition rate while keeping low time complexity, and it is suitable for image classification.

作者冯辉荆晓远朱小柯

机构地区武汉大学计算机学院

出处《计算机应用》 CSCD 北大核心 2017年第7期1960-1966,共7页 journal of Computer Applications

基金国家自然科学基金资助项目(61272273)~~

关键词图像分类字典学习稀疏表示多视图学习特征学习 image classification dictionary learning sparse representation multi-view learning feature learning

分类号 TP391.413 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1程晓雅,王春红.基于特征化字典的低秩表示人脸识别[J].计算机应用,2016,36(12):3423-3428. 被引量：5
2余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：597

二级参考文献16

1MarkoffJ. How many computers to identify a cat?[NJ The New York Times, 2012-06-25.
2MarkoffJ. Scientists see promise in deep-learning programs[NJ. The New York Times, 2012-11-23.
3李彦宏.2012百度年会主题报告:相信技术的力量[R].北京:百度,2013.
410 Breakthrough Technologies 2013[N]. MIT Technology Review, 2013-04-23.
5Rumelhart D, Hinton G, Williams R. Learning representations by back-propagating errors[J]. Nature. 1986, 323(6088): 533-536.
6Hinton G, Salakhutdinov R. Reducing the dimensionality of data with neural networks[J]. Science. 2006, 313(504). Doi: 10. 1l26/science. 1127647.
7Dahl G. Yu Dong, Deng u, et a1. Context-dependent pre?trained deep neural networks for large vocabulary speech recognition[J]. IEEE Trans on Audio, Speech, and Language Processing. 2012, 20 (1): 30-42.
8Jaitly N. Nguyen P, Nguyen A, et a1. Application of pretrained deep neural networks to large vocabulary speech recognition[CJ //Proc of Interspeech , Grenoble, France: International Speech Communication Association, 2012.
9LeCun y, Boser B, DenkerJ S. et a1. Backpropagation applied to handwritten zip code recognition[J]. Neural Computation, 1989, I: 541-551.
10Large Scale Visual Recognition Challenge 2012 (ILSVRC2012)[OLJ.[2013-08-01J. http://www. image?net.org/challenges/LSVRC/2012/.

共引文献600

1贾彦哲.论人工智能研发者过失犯的注意义务[J].华中师范大学研究生学报,2020(2):40-46.
2毕思文,Henri Jaffrès,Chandra Sekhar Roychoudhuri.量子遥感发展新态势——世界首次量子遥感国际会议评述[J].全球变化数据学报（中英文）,2019,3(4):317-325. 被引量：1
3范敏,胥小波,聂小明.基于字符级扩张卷积网络的Web攻击检测方法[J].计算机应用研究,2020,37(S02):234-237. 被引量：4
4孟威,尉永清,刘文锋.基于CRT机制混合神经网络的特定目标情感分析[J].计算机应用研究,2020,37(2):360-364. 被引量：2
5华夏,王新晴,马昭烨,王东,邵发明.基于递归神经网络的视频多目标检测技术[J].计算机应用研究,2020,37(2):615-620. 被引量：8
6刘树霄,衣立,张苏平,时晓曚,薛允传.基于全卷积神经网络方法的日间黄海海雾卫星反演研究[J].海洋湖沼通报,2019(6):13-22. 被引量：11
7王海涛.自主无人系统——概念、体系架构和设计要素[J].电信快报,2021(5):6-9.
8郭龙银,扎西多吉,尚慧杰,旦增.基于LSTM的藏语语音识别[J].电脑知识与技术,2020,0(4):154-155. 被引量：2
9李佳意,董万鹏,任梦,张吉超,弓成美琪.新时代计算机智能制造模式的研究进展[J].智能计算机与应用,2021,11(3):98-105. 被引量：1
10唐公田.杏砧杏快速育苗新技术[J].科技致富向导,2000(4):26-26.

同被引文献10

1何炎祥,孙松涛,牛菲菲,李飞.用于微博情感分析的一种情感语义增强的深度学习模型[J].计算机学报,2017,40(4):773-790. 被引量：127
2鲜征征,李启良,李改,李磊.差分隐私在协同过滤算法中的应用研究[J].计算机科学,2017,44(5):81-88. 被引量：3
3周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1649
4王豪,徐正全,熊礼治,王涛.CLM:面向轨迹发布的差分隐私保护方法[J].通信学报,2017,38(6):85-96. 被引量：8
5尹静,闫河.训练样本数量选择对图像特征提取的影响分析[J].重庆理工大学学报（自然科学）,2017,31(10):192-197. 被引量：2
6白琮,黄玲,陈佳楠,潘翔,陈胜勇.面向大规模图像分类的深度卷积神经网络优化[J].软件学报,2018,29(4):1029-1038. 被引量：63
7韩山杰,谈世哲.基于TensorFlow进行股票预测的深度学习模型的设计与实现[J].计算机应用与软件,2018,35(6):267-271. 被引量：30
8张占军,彭艳兵,程光.基于CIFAR-10的图像分类模型优化[J].计算机应用与软件,2018,35(3):177-181. 被引量：13
9刘东江,黎建辉.基于主动学习的微博数据分类[J].计算机应用研究,2018,35(3):803-806. 被引量：1
10崔建京,龙军,闵尔学,于洋,殷建平.同态加密在加密机器学习中的应用研究综述[J].计算机科学,2018,45(4):46-52. 被引量：5

引证文献1

1李英,贺春林.面向深度神经网络训练的数据差分隐私保护随机梯度下降算法[J].计算机应用与软件,2020,37(4):252-259. 被引量：4

二级引证文献4

1岑鹏,郑德生,陆超.基于差分隐私的航空发动机喘振故障检测[J].燃气涡轮试验与研究,2022,35(1):48-51.
2林魂,孙新毅,宋西翔,蒙春,熊雯欣,黄俊和,刘洪博,刘成.基于改进人工神经网络的页岩气井产量预测模型研究[J].油气藏评价与开发,2023,13(4):467-473. 被引量：2
3庄妍,王林萍.基于神经网络模型的智能产业板块股价探究[J].科技和产业,2023,23(14):250-258.
4张效禹,黄国言,杨永涛,包锋.基于改进CNN的草莓成熟度分类方法[J].食品与机械,2023,39(10):130-137. 被引量：1

1张熹.网络直播为什么这么火[J].高中生（职教创客）,2017,0(8):7-7.
2董强.基于遗传算法的驾校训练课程安排与管理[J].科技通报,2017,33(6):270-274.
3黄伟,王晓辉,江玉珍.基于列最近邻的线性鉴别分析方法及应用[J].计算机工程与应用,2017,53(13):211-215. 被引量：2
4刘虹,王文祥,李维诗.三维扫描测头精确跟踪的摄影测量方法[J].计算机应用,2017,37(7):2057-2061. 被引量：6
5张亚军,刘宗田,周文.基于深度信念网络的事件识别[J].电子学报,2017,45(6):1415-1423. 被引量：12
6王伟.基于纹理特征和支持向量机的三维人脸表情识别[J].计算机时代,2017(7):60-64. 被引量：2
7胡祖奎,余建桥,梁爽.一种基于分层模板的人脸检测方法[J].西南师范大学学报（自然科学版）,2017,42(6):112-120. 被引量：2

计算机应用

2017年第7期

浏览历史

内容加载中请稍等...

基于多视图特征投影与合成解析字典学习的图像分类被引量：1

参考文献2

二级参考文献16

共引文献600

同被引文献10

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于多视图特征投影与合成解析字典学习的图像分类 被引量：1

参考文献2

二级参考文献16

共引文献600

同被引文献10

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于多视图特征投影与合成解析字典学习的图像分类被引量：1