基于神经网络的图像描述实现

Implementation of Image Caption Based on Neural Network

下载PDF

导出

摘要图像描述作为结合图像和文本领域的深度学习任务,拥有广泛的应用场景,现有图像描述模型都是针对大型英文数据集,在小型数据集及其他语言数据集上没有太多关注,本文使用多种神经网络模型实现图像描述,同时验证不同图像描述模型在其他语言上的有效性。实验证明,使用预训练Res Net101后的自适应注意力图像描述模型在多语言Flickr8k数据集上拥有较好效果,Bleu-4值达到20.4,CIDEr值达到54,且模型在汉语及俄语等非英语语言上同样有效。 Image caption is a deep learning task that combines image and text fields. It has a wide range of application scenarios. The existing image caption models are all for large English datasets. There is not much attention on small datasets and other language datasets. This article uses multiple neural network model realizes image caption and verifies the effectiveness of different image caption models in other languages. Experiments have proved that the adaptive attention image caption model after pre-training ResNet101 has good results on the multilingual Flickr8 k dataset. The Bleu-4 value reaches 20. 4 and the CIDEr value reaches 54. It is also valid for non-English languages such as Chinese and Russian.

作者张大任艾山·吾买尔 ZHANG Daren;AISHAN Wumaier(College of Information Science and Engineering,Xinjiang University,Urumqi 830046;Xinjiang Laboratory of Multi-Language Information Technology,Xinjiang University,Urumqi 830046)

机构地区新疆大学信息科学与工程学院新疆大学新疆多语种信息技术实验室

出处《现代计算机》 2021年第19期117-123,共7页 Modern Computer

关键词神经网络图像描述注意力 Flickr8k 多语言 Neural Network Image Caption Attention Flickr8k Multilingual

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

1王栋.Python的计算机软件应用技术分析[J].电子测试,2021,32(14):120-122. 被引量：5
2胡妮妮.选好学习材料,寻找提升数感的通关秘籍——“1000以内数的认识”磨课历程与思考[J].小学数学教育,2021(9):29-31.
3Yuan Yuan,Peng Li,Jing Ye.Lipid homeostasis and the formation of macrophage-derived foam cells in atherosclerosis[J].Protein & Cell,2012,3(3):173-181. 被引量：46
4中华医学会杂志社关于论文二次发表的声明[J].中华创伤杂志,2021,37(7):612-612.
5陈紫璇.马来西亚华语口语里的动词“中”[J].现代交际,2020(9):88-89.
6尕豆草.“学好普通话,走遍天下也不怕”——浅谈对普通话的认识[J].文学少年,2021(22):0390-0391.

现代计算机

2021年第19期

浏览历史

内容加载中请稍等...

基于神经网络的图像描述实现

相关作者

相关机构

相关主题

浏览历史