基于GoogLeNet和双层GRU的图像描述被引量：6

Image description based on GoogLeNet and double-layer GRU

下载PDF

导出

摘要针对基于卷积神经网络(convolutional neural network,CNN)和长短期记忆网络(long short-term memory,LSTM)的方法存在计算复杂度高、收敛速度慢、训练时间长等问题,本文提出基于GoogLeNet和双层GRU的图像描述模型,在训练阶段采用适应性动量估计法(adaptive moment estimation,Adam)优化算法,加快了整体模型的收敛速率,提高了模型性能。在MSCOCO和Flickr30K两个数据集上的实验结果表明,基于GoogLeNet和双层GRU的图像描述模型实验效果优于目前常用的图像描述模型,生成的句子准确度更高,在多个评价指标上超过了其他常用图像描述模型。 The method based on CNN and LSTM is currently the mainstream method of image description.Although this method has made great progress in image description,it still has problems such as high computational complexity,slow convergence speed and long training time.To solve these problems,an image description model based on GoogLeNet and double-layer GRU is proposed.The Adam optimization algorithm is used in the training stage to accelerate the overall model′s convergence rate and improve the model performance.Experimental results on the two datasets of MSCOCO and Flickr30K show that the image description model based on GoogLeNet and double-layer GRU has better experimental results than the commonly used image description model.The generated sentence is more accurate and exceeds other currently used image description models in multiple evaluation indicators.

作者张洁庆郭敏肖冰 ZHANG Jieqing;GUO Min;XIAO Bing(School of Computer Science,Shaanxi Normal University,Xi′an 710119,Shaanxi,China)

机构地区陕西师范大学计算机科学学院

出处《陕西师范大学学报（自然科学版）》 CAS CSCD 北大核心 2021年第1期68-73,共6页 Journal of Shaanxi Normal University：Natural Science Edition

基金国家自然科学基金(61401265)。

关键词图像描述 GoogLeNet 门限递归单元适应性动量估计法 image description GoogLeNet gated recurrent unit(GRU) adaptive moment estimation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献55

1林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：22
2杨德亮,魏燕定,周冠雄,曹振波.基于PSD的织物引导线跟踪器设计[J].纺织学报,2010,31(6):129-133. 被引量：4
3鲁明,王真水,田元,李琳.一种基于Kinect的虚拟现实姿态交互工具[J].系统仿真学报,2013,25(9):2124-2130. 被引量：13
4李坤,谭梦羽.基于小波支持向量机回归的股票预测[J].统计与决策,2014,30(6):32-36. 被引量：14
5邱桃荣,肖勇峰,张虹,黄瑶.伴随二元关系粒运算的布料色卡图像检索模型[J].南昌大学学报（工科版）,2015,37(1):61-70. 被引量：2
6薛乐,李立轻,汪军.应用频谱图的机织物纹理分析[J].纺织学报,2015,36(7):55-60. 被引量：12
7吴文娣,程希骏,刘峰.基于K-means聚类和广义熵约束的CVaR投资组合模型[J].中国科学院大学学报（中英文）,2016,33(1):31-36. 被引量：4
8肖勇锋,邱桃荣,余宇婷,刘萍,余松森.基于Android的色卡识别系统的设计与实现[J].南昌大学学报（工科版）,2016,38(2):183-190. 被引量：2
9王洋,余祖俊,朱力强,郭保青.基于CNN的高速铁路侵限异物特征快速提取算法[J].仪器仪表学报,2017,38(5):1267-1275. 被引量：37
10李勇,林小竹,蒋梦莹.基于跨连接LeNet-5网络的面部表情识别[J].自动化学报,2018,44(1):176-182. 被引量：100

引证文献6

1邓宇平,王桂棠.基于GoogleNet网络与残差网络的织物纹理分析[J].电子测量技术,2021,44(7):31-38. 被引量：4
2崔梓晗,魏昕怡,邱桃荣,邹凯.布料色卡图像检索的深度学习模型[J].南昌大学学报（工科版）,2021,43(2):178-186.
3任彬,汪小雨.面向航天测发任务的动作识别与追踪研究[J].系统仿真学报,2022,34(8):1674-1681.
4徐武,高寒,王欣达,张强,秦浩然,吴庆畅.基于改进的Faster R-CNN网络的绝缘子识别算法[J].云南民族大学学报（自然科学版）,2023,32(5):595-600.
5付义峰,肖贺.基于TCN和双重注意力的股价预测模型[J].计算机仿真,2024,41(6):345-353.
6柯杰,曾上游,黄飞燕,雷松橦.基于卷积神经网络的图像描述生成改进算法[J].计算机仿真,2024,41(7):216-221.

二级引证文献4

1张伟,张俊杰,宋杰,吕圣,王生怀.基于改进SwinIR的条纹图去噪方法[J].电子测量技术,2023,46(23):105-111.
2杨桂华,戴志诚.基于机器视觉的铝塑泡罩药品包装检测研究[J].电子测量技术,2023,46(20):140-147.
3郑雨婷,王成群,陈亮亮,吴江,吕文涛.基于卷积神经网络的织物图像识别方法研究进展[J].现代纺织技术,2022,30(5):1-11. 被引量：15
4蒙建国,任其科,王凯,赵祥,石炜.基于深度学习的风力机叶片表面缺陷检测研究[J].计算机与数字工程,2024,52(5):1502-1509.

1童鸽,徐悦,王啸.基于多阶增量预测Exp-Golomb算法的冲击波数据压缩[J].长春理工大学学报（自然科学版）,2021,44(1):81-86.
2姜跟华.“二氧化碳熄灭蜡烛”实验改进的分析与优化[J].实验教学与仪器,2021,38(1):30-33. 被引量：2
3回征,周诠.一种适用于遥感图像的可逆信息隐藏算法[J].中国空间科学技术,2020,40(6):106-114. 被引量：1
4邓珍荣,张永林,杨睿,蓝如师,黄文明,罗笑南.结合全局和局部特征的BiGRU-RA图像中文描述模型[J].计算机辅助设计与图形学学报,2021,33(1):49-58. 被引量：2
5时艳玲,刘子鹏,张学良,顾为亮.基于EMD能量占比的海面漂浮小目标特征检测[J].系统工程与电子技术,2021,43(2):300-310. 被引量：5
6陈赞君.巧用“试管透镜”观察色素溶液的吸收光谱[J].实验教学与仪器,2021,38(1):44-44.
7吴昭军,张立民,钟兆根.低信噪比下卷积交织器识别[J].系统工程与电子技术,2021,43(2):546-554. 被引量：1
8Benjamin Spieler,Eric A.Mellon,Patricia D.Jones,Huan Giap,Lynn Feun,Shree Venkat,LorrainePortelance.Stereotactic ablative radiotherapy for hepatocellular carcinoma[J].Hepatoma Research,2019,5(1):36-48. 被引量：2
9何铁锋,潘国兵,王萌,王红志,杨灿,Chen Zhichao.激光应用系统设计课程实验教学设计与实践[J].中国现代教育装备,2021(1):94-96.
10石小敢,高岩,王闯,安晶晶,燕达,田喆,章文杰.基于用户侧整体模型的风机盘管系统模拟方法研究[J].建筑科学,2020,36(12):38-45. 被引量：1

陕西师范大学学报（自然科学版）

2021年第1期

浏览历史

内容加载中请稍等...

基于GoogLeNet和双层GRU的图像描述被引量：6

同被引文献55

引证文献6

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于GoogLeNet和双层GRU的图像描述 被引量：6

同被引文献55

引证文献6

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于GoogLeNet和双层GRU的图像描述被引量：6