基于深度神经网络的图像语句转换方法发展综述被引量：1

Survey on Converting Image to Sentence Based on Depth Neural Networks

下载PDF

导出

摘要在当前大数据时代,图像由于具有丰富的语义而成为大众获取相关信息的重要来源。基于深度模型的图像语义分析是一种通过深度模型将图像内容转换成可直观理解的语义知识的技术,受到了国内外研究者的广泛关注。该技术根据生成目标语义层次的差异,可分为单类别、多标签和语句3类。首先介绍了以上3类方法对应的深度模型的结构特点,并从技术的演化趋势角度对比分析了3类方法的技术特点和发展现状;然后重点对图像语句转换方法的发展现状、应用场景与性能要求的差异进行了论述,同时对图像语句转换方法的步骤进行分解和论述,从学术界和产业界两方面进行了详细的对比分析,指出了二者的不同研究侧重点与对应的发展现状;最后对具有深度模型的图像语句转换方法进行了总结和展望,指明了该方法当前存在的问题与发展趋势。 In the context of big data,the number of images increases rapidly,and knowledge acquisition is of great significance to the use and analysis of images.Image semantic analysis method based on deep model is a technique which can convert image content into intuitive understandable semantic knowledge through deep model,attracting wide attention at home and abroad.The target of image semantic analysis method can be divided into phrases,multiple tags,and statements.This paper introduced the research status of the above methods and their advantages,and analyzed the features of the image during the process of knowledge acquisition and the existing problems,including the structural features of convolutional neural network and the recurrent neural network.From the aspects such as model structure and connection,this paper analyzed the research hotspot and the cases,then analyzed the differences between academia and industry,and adopted image sentence conversion to excute a discriminant comparison.Finally,this paper drew a conclusion and gave its hope for the images semantic analysis method with deep model.

作者毛典辉薛子育李子沁王帆

机构地区北京工商大学计算机与信息工程学院食品安全大数据技术北京市重点实验室

出处《计算机科学》 CSCD 北大核心 2018年第3期23-28,共6页 Computer Science

基金教育部人文科学社会基金项目(17YJCZH127) 北京工商大学两科基金项目(LKJJ2017-13)资助

关键词深度模型图像语义分析卷积神经网络递归神经网络支持向量机 Deep model Image semantic analysis Convolutional neural network Recurrent neural network Support vector machine

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,37(6):1225-1240. 被引量：195

二级参考文献67

1Marr D.Vision:A Computational Investigation Into the Human Representation and Processing of Visual Information.Cambridge:The MIT Press,2010.
2LeCun Y,Bottou L,Bengio Y,Haffner P.Gradient-based learning applied to document recognition.Proceedings of the IEEE,1998,86(11):2278-2324.
3Ferrari V,Jurie F,Schmid C.From images to shape models for object detection.International Journal of Computer Vision,2009,87(3):284-303.
4Latecki L J,Lakamper R,Eckhardt U.Shape descriptors for non rigid shapes with a single closed contour//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Hilton Head,USA,2000,1:424-429.
5Krizhevsky A.Learning Multiple Layers of Features from Tiny Images[M.S.dissertation].University of Toronto,2009.
6Torralba A,Fergus R,Freeman W T.80 million tiny images:A large dataset for non-parametric object and scene recognition.IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,30(11):1958-1970.
7Li FebFei,Fergus R,Perona P.Learning generative visual models from few training examples:An incremental Bayesian approach tested on 101 object categories//Proceedings of the Computer Vision and Pattern Recognition (CVPR),Workshop on Generative-Model Based Vision.Washington,USA,2004:178.
8Griffin G,Holub A D,Perona P.The Caltech 256.Caltech Technical Report CNS-TR-2007-001.
9Lazebnik S,Schmid C,Ponce J.Beyond bags of features:Spatial pyramid matching for recognizing natural scene categories//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).New York,USA,2006:2169-2178.
10Li Fei-Fei,Perona P.A Bayesian hierarchical model for learning natural scene categories//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Washington,USA,2005:524-531.

共引文献194

1毛自新,王添.TensorFlow人脸识别技术在采煤工作面的应用研究[J].工矿自动化,2024,50(S01):78-81.
2高璇,毕晓君.基于改进Faster R-CNN的低剂量CT图像肺结节检测[J].计算机应用研究,2020,37(S02):404-406. 被引量：2
3陆晔,孙晓凯,李梦媛.基于“检测+分类”模型融合的物体识别应用分析[J].电信科学,2020,36(S01):276-283. 被引量：1
4孙晓凯,倪卿元,陈文强.图像增强方法在深度学习图像识别场景应用中的可行性研究[J].电信科学,2020,36(S01):172-179. 被引量：10
5闫晓婧,闫浩文,王小龙,王卓,马文骏.微地图符号的智能化匹配——“识图配符”[J].测绘科学,2022,47(10):205-212. 被引量：8
6刘鹏翼.智能视频分析技术及应用[J].网络安全技术与应用,2018(12):127-127. 被引量：4
7高薇,曾健民.基于卷积神经网络算法的图像识别应用研究[J].西安文理学院学报（自然科学版）,2019,22(1):10-14. 被引量：8
8施明登,周鹏,白铁成.基于Bag of Words的干果图像分类研究[J].安徽农业科学,2014,42(29):10381-10383. 被引量：1
9侯宾,张文志,戴源成,田洪强.基于OpenCV的目标物体颜色及轮廓的识别方法[J].现代电子技术,2014,37(24):76-79. 被引量：20
10蔡强,刘亚奇,曹健,毛典辉,牛群.图像目标类别检测综述[J].计算机科学与探索,2015,9(3):257-265. 被引量：13

同被引文献25

1李莉,杨治良.解析Dienes&Perner的内隐知识理论[J].黑龙江高教研究,2011,29(6):114-117. 被引量：1
2祝智庭,贺斌.智慧教育:教育信息化的新境界[J].电化教育研究,2012,33(12):5-13. 被引量：1087
3赵泽林.理性主义与经验主义:人工智能的哲学分析[J].系统科学学报,2018,26(4):11-15. 被引量：8
4郑勤华,熊潞颖,胡丹妮.任重道远:人工智能教育应用的困境与突破[J].开放教育研究,2019,25(4):10-17. 被引量：47
5蔡恒进.行为主义、联结主义和符号主义的贯通[J].上海师范大学学报（哲学社会科学版）,2020,49(4):87-96. 被引量：20
6张钹,朱军,苏航.迈向第三代人工智能[J].中国科学：信息科学,2020,50(9):1281-1302. 被引量：170
7吕品,贺云艳,许嘉,莫晓琨.面向教育的中文知识图谱自动构建技术[J].中国教育信息化,2021(4):86-92. 被引量：4
8刘革平,刘选.跨学科比较视域下智慧教育的概念模型[J].电化教育研究,2021,42(3):5-11. 被引量：16
9曾春艳,严康,王志锋,余琰,纪纯妹.深度学习模型可解释性研究综述[J].计算机工程与应用,2021,57(8):1-9. 被引量：30
10郑勤华,郭利明.人机协同的敏捷教育建模及实践应用[J].现代远程教育研究,2021,33(4):43-50. 被引量：22

引证文献1

1廖剑,刘选,刘革平.理感联通:人工智能赋能智慧教育新范式[J].中国电化教育,2023(6):18-24. 被引量：12

二级引证文献12

1徐炎,韩姗姗,王龙,郭庆寅,丁樱.虚拟现实及人工智能对传统医学教育的挑战与变革[J].科学咨询,2023(17):48-50. 被引量：3
2林思雨,周海涛.人工智能融入高校教学科研管理的前景、风险和策略[J].高校教育管理,2023,17(6):21-30. 被引量：7
3张燕.智慧教育时代财贸专业教学模式改革路径研究[J].镇江高专学报,2024,37(1):87-90.
4乜勇,康欣欣.国内人工智能教育应用:研究现状、热点主题和机遇挑战[J].教育文化论坛,2024,16(1):85-94. 被引量：2
5冯薇,吴哲宇,李怡为.“人工智能+教育”深度融合的理论探索与创新启示——基于文献计量学的研究[J].中国成人教育,2023(22):3-10.
6闫桂峰,王宏洲,李学文,李炳照.从“三个能力”到“五步走”:试析智慧教育的建设路径[J].教育信息技术,2024(4):25-29.
7王小勤.智慧教育视域下教师教学素养的框架构建与保障措施[J].教学与管理,2024(21):51-55.
8李晓洁.人工智能时代下“大数据审计”课程教学改革探析[J].老字号品牌营销,2024(16):231-233.
9马英杰,杨亚涛,肖嵩,李莉.“五位一体”通信原理课程智慧教学模式研究与实践[J].计算机科学,2024,51(10):129-134.
10李晓霞,孙赵勇.面向深度学习的高校智慧课堂教学探索[J].计算机教育,2024(10):265-269.

1刘畅.小学作文教学中说写结合的有效策略应用[J].小学生作文辅导,2018,0(1):79-79. 被引量：1
2潘楠.高中英语书面表达训练中的问题及对策[J].青少年日记（教育教学研究）,2017,0(9):103-103.
3李晓坤,郑永亮,袁烺,陈虹旭,邵娜,杨磊,曹晓琪,姜诗萌.基于深度学习的声纹识别方法研究[J].黑龙江大学工程学报,2018,9(1):64-70. 被引量：9
4袁天娇,陈艳红,刘四清,龚建村.基于深度学习递归神经网络的电离层总电子含量经验预报模型[J].空间科学学报,2018,38(1):48-57. 被引量：21
5刘艳.小学古典白话小说类课文教学策略探寻[J].吉林教育,2017,0(48):105-105.
6肖瑶.论汉语颜色反义词的构成机制[J].内江师范学院学报,2018,33(1):76-80. 被引量：1
7王飞,张艳琴.计算机图像语义教学如何对多媒体进行利用[J].现代职业教育,2017,0(27):28-28.
8罗美莲,李刚,李文.废弃膜元件的再应用研究进展[J].科技视界,2017(35):58-59.
9罗美莲.废弃反渗透膜元件的再生方法研究现状[J].山东工业技术,2018(8):45-45.
10赵丽君,周立春,刘文.镍氢电池隔膜纸的关键技术[J].黑龙江造纸,2018,46(1):7-12. 被引量：2

计算机科学

2018年第3期

浏览历史

内容加载中请稍等...

基于深度神经网络的图像语句转换方法发展综述被引量：1

参考文献1

二级参考文献67

共引文献194

同被引文献25

引证文献1

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于深度神经网络的图像语句转换方法发展综述 被引量：1

参考文献1

二级参考文献67

共引文献194

同被引文献25

引证文献1

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于深度神经网络的图像语句转换方法发展综述被引量：1