-
题名混合深度网络在场景识别技术中的应用
被引量:3
- 1
-
-
作者
胡昭华
姜啸远
王珏
邵晓雯
卞飞飞
-
机构
南京信息工程大学电子与信息工程学院
南京信息工程大学江苏省大气环境与装备技术协同创新中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第6期1387-1393,共7页
-
基金
国家自然科学青年基金项目(61601230)资助
江苏省自然科学基金青年基金项目(BK20141004)资助
+3 种基金
江苏省普通高校自然科学研究项目(11KJB510009
14KJB510019)资助
江苏高校优势学科Ⅱ期建设工程项目资助
江苏省大学生实践创新训练计划项目(201510300036Z)资助
-
文摘
场景识别是计算机视觉领域重要的研究方向,场景图片的类间相似性和类内差异性使得场景识别极具挑战性.提出一种混合深度场景识别方法,该模型首先在混合识别的Fisher编码层和判别层之前用深度直连自编码器作为图像局部特征提取层,完善了整个混合深度识别框架.采用直连非监督深度网络输出直接重构输入,能够提取更有判别性的中尺度局部特征.本文还在Fisher编码层引入金字塔空间信息,考虑局部特征空间分布.此外,通过改变场景图片对应局部图像块的构成实现场景数据扩充.引入图片所在类中出现概率低的图像块作为类内干扰加入原图像块中,减少类内差异误判.为了减少类间相似性影响,通过信息熵度量保留图片的类间相似的图像块,引入相似类中特有的关键图像块,替换原先类别相关的图像块,同时改变对应标签,突出关键图像块对相似类别判断的决定性.在scene15数据集上的实验表明本文方法可以有效提高场景识别的准确率.
-
关键词
场景识别
混合深度结构
直连卷积自编码
金字塔Fisher编码
数据扩充
-
Keywords
scene classification
hybrid deep network
directly connected convolutional autoencoder
spatial pyramid fisher
data augmentation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-