面向移动平台的深度学习复杂场景目标识别应用被引量：4

A deep learning based object detection application for mobile platform in complex scenes

下载PDF

导出

摘要针对传统建筑物提取方法对人为设计的依赖,以及对建筑物边缘特征提取算法的改进,通过Keras框架获取卷积神经网络(convolutional neural networks,CNN)模型MobileNet的瓶颈层后加入新的分类器进行迁移学习,对输入图片进行大量的图像增强技术和测试集增强技术,经过三个阶段的迁移学习后获得了较高的准确率。相比其他的特征提取算法,CNN具有平移不变性以及自动提取特征等优点,在较短的时间内获得较高准确率的同时,MobileNet的权重仅有15.3 MB,兼顾计算量和精度,可以广泛移植到移动端设备。基于模型移植的移动端系统兼具拍照识别、相册识别、菜单展示等功能,为移动平台用户快速准确地判断自然场景中建筑物的信息提供了便捷工具。 Due to the presence of background noise in natural scenes and the interference of complex factors such as illumination, rotation, and shooting angle, it is very difficult to identify the image of buildings in natural scenes. Aiming at the dependence of traditional building extraction methods on human design and the improvement of building edge feature extraction algorithm.Through the Keras framework to obtain the bottleneck layer of convolutional neural networks(CNN) model MobileNet,and add a new classifier for transfer learning. A large number of data augmentation and test set augmentation are applied to the input image. After three versions of transfer learning, high accuracy was achieved within 480 iterations in three test set. Compared with other feature extraction algorithms, CNN has the advantages of non-transformation and automatic extraction of features, achieves higher accuracy in a shorter period of time. At the same time, MobileNet weight only occupy 15.3 MB with high precision and less calculation, which can be widely transplanted to mobile devices. The system based on model migration has the functions of photo recognition, photo album recognition, menu display, etc., providing mobile platform users with a convenient and simple tool to quickly and accurately obtain the information of buildings in natural scenes.

作者许博鸣刘晓峰业巧林张福全周京正 XU Boming;LIU Xiaofeng;YE Qiaolin;ZHANG Fuquan;ZHOU Jingzheng(College of Information Science and Technology, Nanjing Forestry University, Nanjing 210037, Jiangsu, China;Bureau of Information Technology, Ministry of Public Security of the People′s Republic of China, Beijing 100741, China)

机构地区南京林业大学信息科学技术学院中华人民共和国公安部科技信息化局

出处《陕西师范大学学报（自然科学版）》 CAS CSCD 北大核心 2019年第5期10-15,共6页 Journal of Shaanxi Normal University：Natural Science Edition

基金国家自然科学基金(61871444,31670554) 南京林业大学大学生创新训练计划项目(2017NFUSPITP231)

关键词迁移学习深度学习卷积神经网络移动平台移植人工智能 transfer learning deep learning convolutional neural network mobile system transplantation artificial intelligence

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1范荣双,陈洋,徐启恒,王竞雪.基于深度学习的高分辨率遥感影像建筑物提取方法[J].测绘学报,2019,48(1):34-41. 被引量：70
2李红,刘芳,杨淑媛,张凯.基于深度支撑值学习网络的遥感图像融合[J].计算机学报,2016,39(8):1583-1596. 被引量：39
3焦李成,杨淑媛,刘芳,王士刚,冯志玺.神经网络七十年:回顾与展望[J].计算机学报,2016,39(8):1697-1716. 被引量：369
4周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1751
5曲延云,郑南宁,李翠华,袁泽剑,叶聪颖.基于支持向量机的显著性建筑物检测[J].计算机研究与发展,2007,44(1):141-147. 被引量：11

二级参考文献29

1王守觉,曹文明.半导体神经计算机的硬件实现及其在连续语音识别中的应用[J].电子学报,2006,34(2):267-271. 被引量：3
2D M McKeown.Toward automatic cartographic feature extractionIn:Mapping and Spatial Modelling for Navigation[C].NATO ASI Series.Berlin:Springer-Verlag,1990,F65:149-180
3R B Irvinm,D M McKeown.Methods for exploiting the relationship between buildings and their shadows in aerial imagery[J].IEEE Trans on Systems,Man,and Cybernetics,1989,19(6):1564-1575
4J C McGlone,J A Shufelt.Projective and object space geometry for monocular building extraction[C].IEEE Conf on Computer Vision and Pattern Recognition,Washington,USA,1994
5J A Shufelt.Exploiting photogrammetric methods for building extraction in aerial images[J].Int'l Archives of Photogrammetry and Remote Sensing,1996,31(B6/S):74-79
6J A Shufelt.Projective geometry and photometry for object detection and delineation[R].Carnegie Mellon University,Tech Rep:CMU-CS-96-164,1996
7C Lin,R Nevatia.Building detection and description from a single intensity image[J].Computer Vision and Image Understanding,1998,72(2):101-121
8Yunqi Song,Aidong Zhang.Analyzing scenery images by monotonic tree[J].ACM Multimedia Systems Journal,2002,8(6):495-511
9A Iqbal,J K Aggarwal.Applying perceptual grouping to content-based image retrieval:Building images[C].IEEE Int'l Conf on CVPR,Fort lolins,lolorado,1999
10S Kumar,M Hebert.Man-made structure detection in natural images using a causal multiscale random field[C].IEEE Int'l Conf on CVPR,Madison,USA,2003

共引文献2194

1陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：7
4朱新乐.基于BP神经网络的绿色供应链优化研究[J].运输经理世界,2023(11):156-158.
5林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：22
6陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：20
7鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：13
8谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126.
9任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：3
10胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2

同被引文献36

1刘文华,李浥东,王涛,邬俊,金一.基于高维特征表示的交通场景识别[J].智能科学与技术学报,2019,0(4):392-399. 被引量：3
2胡春生,王德,赵汇东.人体步态特征数据分析和人物身份识别方法研究[J].计算机应用研究,2020,37(S02):129-132. 被引量：5
3高滢,刘大有,齐红,刘赫.一种半监督K均值多关系数据聚类算法[J].软件学报,2008,19(11):2814-2821. 被引量：22
4杨绪兵,潘志松,陈松灿.半监督型广义特征值最接近支持向量机[J].模式识别与人工智能,2009,22(3):349-353. 被引量：4
5徐庆伶,汪西莉.一种基于支持向量机的半监督分类方法[J].计算机技术与发展,2010,20(10):115-117. 被引量：18
6马蕾,汪西莉.基于支持向量机协同训练的半监督回归[J].计算机工程与应用,2011,47(3):177-180. 被引量：13
7张春涛,郭皎,徐家良.基于稀疏表示的半监督降维方法[J].计算机工程与应用,2011,47(20):181-183. 被引量：8
8方玲,陈松灿.结合特征偏好的半监督聚类学习[J].计算机科学与探索,2015,9(1):105-111. 被引量：3
9刘建伟,刘媛,罗雄麟.半监督学习方法[J].计算机学报,2015,38(8):1592-1617. 被引量：134
10张云斌,张春梅,周千琪,戴模.基于l^1范数和k近邻叠加图的半监督分类算法[J].模式识别与人工智能,2016,29(9):850-855. 被引量：2

引证文献4

1杨红鑫,杨绪兵,张福全,业巧林.半监督平面聚类算法设计[J].南京大学学报（自然科学版）,2020,56(1):9-18. 被引量：2
2刘方舟,刘浩,云挺.基于分水岭优化思想的单木信息分割算法[J].林业工程学报,2020,5(5):109-116. 被引量：8
3张百川,赵佰亭.结合批归一化的轻量化卷积神经网络分类算法[J].哈尔滨商业大学学报（自然科学版）,2021,37(3):300-306. 被引量：8
4高梦.基于Faster R-CNN的动漫场景多人物自动识别研究[J].佳木斯大学学报（自然科学版）,2024,42(3):53-57.

二级引证文献18

1闫新庆,贾营,赵丽,李雅琪,张晨曦.基于改进YOLOv5模型的印章识别[J].电子测量技术,2023,46(2):169-174.
2李潇岩,卢宝松.聚类算法下的饲料粉碎机性能优化研究[J].农机化研究,2021,43(12):42-45.
3白云龙,傅彬,史振华,王健.基于标记分水岭算法的插秧机器人导航路径检测[J].中国农机化学报,2021,42(7):142-147. 被引量：3
4花伟成,田佳榕,孙心雨,徐雁南.基于TLS数据的杨树削度方程建立及材积估算[J].南京林业大学学报（自然科学版）,2021,45(4):41-48. 被引量：7
5张真维,赵鹏,韩金城.基于双目视觉的树木高度测量方法研究[J].林业工程学报,2021,6(6):156-164. 被引量：9
6陈立鹏,陈小龙,宋诗凡,陈桢衍.基于多模态语义识别的语音识别报警系统[J].科学技术创新,2022(2):89-92. 被引量：1
7胡迎香,高红旗,夏万求,黄其欢,陈志欣,王德柱.机载雷达点云亚热带针叶林单木分割探究[J].应用激光,2021,41(6):1301-1309. 被引量：6
8周辰琴,余拥军,方陆明,刘雨真,胡建锦.飞行高度与郁闭度对水杉冠幅提取影响的研究[J].林业资源管理,2022(1):150-156. 被引量：3
9邹琪华,张宇辰,蔡君,蔡清清.人工智能在肿瘤领域的应用——科学研究和教学实践中的进展[J].癌症,2022,41(2):49-56. 被引量：8
10李晋国,焦旭斌.雾计算环境下入侵检测模型研究[J].计算机工程,2022,48(5):43-52.

1张勤.媒介融合背景下的数字媒介传播策略及特点研究[J].参花（下）,2019,0(7):85-86. 被引量：1
2张震强,张星,曲文敬,刘麟.移动通信无线技术智能化发展研究[J].数字通信世界,2019,0(8):64-64. 被引量：2
3刘雨涵.移动应用中的色彩对用户体验的影响[J].锋绘,2019,0(8):33-33.
4张传金,李燕林,张永义,王扩.基于深度学习的头盔佩戴自动检测[J].电脑编程技巧与维护,2019,0(8):126-130. 被引量：2
5赵涛,王振华,毛宏霞,包醒东,陈轩.动态场景目标光、电特性仿真方法综述[J].上海航天,2019,36(4):90-97. 被引量：1
6吕亚辉,么娆,严雨灵.基于GA-PSO算法的机器人手势交互轨迹规划研究[J].组合机床与自动化加工技术,2019(9):50-54. 被引量：7
7刘金,刘哲,倪虹,陶青长.双/多基SAR回波信号仿真技术研究[J].系统仿真学报,2019,31(8):1477-1483. 被引量：2
8曹红根,高广银,唐传敏.基于Android的巡防系统的设计与实现[J].电脑知识与技术,2019,15(8Z):38-39. 被引量：1
9马翔.推进高校媒介融合与做好网络思想政治教育的思考[J].青年与社会,2019,0(29):215-216.
10邝辉宇,吴俊君.基于深度学习的图像语义分割技术研究综述[J].计算机工程与应用,2019,55(19):12-21. 被引量：50

陕西师范大学学报（自然科学版）

2019年第5期

浏览历史

内容加载中请稍等...

面向移动平台的深度学习复杂场景目标识别应用被引量：4

参考文献5

二级参考文献29

共引文献2194

同被引文献36

引证文献4

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

面向移动平台的深度学习复杂场景目标识别应用 被引量：4

参考文献5

二级参考文献29

共引文献2194

同被引文献36

引证文献4

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

面向移动平台的深度学习复杂场景目标识别应用被引量：4