结合特权信息与注意力机制的场景识别被引量：1

Scene Recognition Based on Privilege Information and Attention Mechanism

下载PDF

导出

摘要在场景识别中,为了在只有RGB图像的测试阶段也能利用深度图像与RGB图像所包含的互补信息,以深度图像为特权信息,提出了一种端到端可训练的深度神经网络模型,用以结合特权信息和注意力机制。在该模型中,以图像编码到特征解码再到图像编码为架构,建立了由RGB图像到深度图像再到深度图像高层语义特征的映射关系。通过注意力机制,将RGB图像高层语义特征与对应的深度图像高层语义特征进行融合,输入分类网络,最终得到预测结果。在测试时,只需要输入RGB图像,便可在该模型获取的深度图像特权信息的帮助下,提升场景识别的性能。大量实验结果表明:本文方法在SUN RGB-D和NYUD2两个场景识别数据库中分别取得了51.5%和65.4%的识别正确率,验证了所提方法的有效性。 In the scene recognition,in order to use the complementary information contained in the depth images and the RGB images in the test phase with only RGB images,this paper used the depth image as the privilege information,and proposed an end-to-end trainable deep neural network model to combine the privilege information and attention mechanism.In the proposed method,the image encoding,feature decoding and then image encoding were used as the framework to establish a mapping relationship from RGB images to depth images and to high-level semantic features of depth images.By using of the attention mechanism,the high-level semantic features of RGB images were fused with the corresponding high-level semantic features of the depth image.And these two features were fed into the classification network to make the final prediction.In the test phase,only RGB images would be used,and the performance of scene recognition could be improved with the help of privilege information extracted from depth image.Through a large number of experiments,the method in this paper achieved 51.5%in the SUN RGB-D scene identification database and 65.4%in NYUD2 database,which verified the effectiveness of the method in this paper.

作者孙宁王龙玉刘佶鑫韩光 SUN Ning;WANG Longyu;LIU Jixin;HAN Guang(Engineering Research Center of Wideband Wireless Communication Technology of Ministry of Education, Nanjing University of Posts and Telecommunications, Nanjing 210003, China;School of Communication and Information Engineering, Nanjing University of Posts and Telecommunications, Nanjing 210003, China)

机构地区南京邮电大学宽带无线通信技术教育部工程研究中心南京邮电大学通信与信息工程学院

出处《郑州大学学报（工学版）》 CAS 北大核心 2021年第1期42-49,共8页 Journal of Zhengzhou University（Engineering Science）

基金国家自然科学基金资助项目(61471206,61871445) 江苏省优秀青年基金项目(BK20180088)。

关键词场景识别特权信息注意力卷积神经网络 scene recognition privilege information attention mechanism convolutional neural network

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献19

1刘文华,李浥东,王涛,邬俊,金一.基于高维特征表示的交通场景识别[J].智能科学与技术学报,2019,0(4):392-399. 被引量：3
2胡春生,王德,赵汇东.人体步态特征数据分析和人物身份识别方法研究[J].计算机应用研究,2020,37(S02):129-132. 被引量：5
3花逢春.广电视频图像人物识别技术与算法[J].科技创新导报,2019,16(6):138-140. 被引量：1
4李均鹏,祝开艳,杨澍.基于迁移学习的复杂场景海洋鱼类识别方法[J].计算机应用与软件,2019,36(9):168-174. 被引量：15
5许博鸣,刘晓峰,业巧林,张福全,周京正.面向移动平台的深度学习复杂场景目标识别应用[J].陕西师范大学学报（自然科学版）,2019,47(5):10-15. 被引量：4
6许博鸣,刘晓峰,业巧林,张福全,周京正.基于卷积神经网络面向自然场景建筑物识别技术的移动端应用[J].南京师范大学学报（工程技术版）,2019,19(3):37-44. 被引量：5
7葛宏孔,罗恒利,董佳媛.基于深度学习的非实验室场景人脸属性识别[J].计算机科学,2019,46(S11):246-250. 被引量：5
8姜虹,贾帅宇,姚红革.胶囊网络对复杂现实场景中的物体识别[J].西安工业大学学报,2019,39(6):712-719. 被引量：2
9雷斯达,曹鸿猷,康俊涛.基于深度学习的复杂场景下混凝土表面裂缝识别研究[J].公路交通科技,2020,37(12):80-88. 被引量：16
10李华,王岩彬,益朋,王藤,王常亮.基于深度学习的复杂作业场景下安全帽识别研究[J].中国安全生产科学技术,2021,17(1):175-181. 被引量：25

引证文献1

1高梦.基于Faster R-CNN的动漫场景多人物自动识别研究[J].佳木斯大学学报（自然科学版）,2024,42(3):53-57.

1鲜开义,彭志远,谷湘煜,梁洪军,蒋鑫,查盛.变电站巡检机器人避障方法研究与应用[J].科学技术与工程,2021,21(5):1957-1962. 被引量：15
2张权,陆小浩,朱士虎,金玫秀,王通.基于改进U-Net的宫颈细胞核图像分割[J].计算机系统应用,2021,30(4):39-45. 被引量：2
3陈舒迪,柴琴琴,张勋,黄泽豪,林羽,徐伟.基于多特征融合和LightGBM的金线莲品系识别[J].江苏农业学报,2021,37(1):155-162. 被引量：3
4周书田,颜信,谢镇汕.视频人脸识别中高效分解卷积与时间金字塔网络研究[J].电子科技大学学报,2021,50(2):231-235. 被引量：3
5戢晓峰,刘丁硕,陈方.考虑需求强度与群体差异的公路旅客出行行为异质性研究[J].北京交通大学学报,2021,45(1):47-61. 被引量：7
6王鑫,李伟,曾子铭,张吟龙.热像仪-RGB相机-IMU传感器的空间联合标定方法[J].仪器仪表学报,2020,41(11):216-225. 被引量：4

郑州大学学报（工学版）

2021年第1期

浏览历史

内容加载中请稍等...

结合特权信息与注意力机制的场景识别被引量：1

同被引文献19

引证文献1

相关作者

相关机构

相关主题

浏览历史

结合特权信息与注意力机制的场景识别 被引量：1

同被引文献19

引证文献1

相关作者

相关机构

相关主题

浏览历史

结合特权信息与注意力机制的场景识别被引量：1