期刊文献+

图像语义相似性网络的文本描述方法 被引量:2

IMAGE CAPTION BASED ON IMAGE SEMANTIC SIMILARITY NETWORK
下载PDF
导出
摘要 图像的文本化描述解决图像理解的高级语义问题。由于存在语义鸿沟,导致自动生成的文本与图像内容有较大差异,浅层神经网络构建的语言模型很难生成通顺的语句。为此,提出图像语义相似性神经网络,在递归神经网络的输出层之后添加全连接网络,引入图像间的视觉相似性和文本相似性信息,从而在预测图像的文本描述时保持相似图像的有效语义信息。增加栈式隐层和普通隐层的深度来提高语言模型的学习能力,最终得到接近自然语言的文本。实验结果表明,该方法在BLEU、ROUGE、METEOR和CIDEr等评价指标上均取得较好的效果,能够生成符合图像内容的高质量文本描述。 Image caption solves the problem of high level semantic image understanding. Due to the semantic gap, there are differences between the generative captions and images, and the shallow neural network based language model is hard to generate smooth sentences. To solve this problem, this paper proposes image semantic similarity neural network, which adds full connected layers after the output layer of recurrent neural network, and thus introduce the visual similarity and semantic similarity information between images. Besides, this method increases the depth of stacked hidden layers and common hidden layers to improve the learning ability of language model, and finally obtain image captions close to human natural language. Experiments show that the proposed method get great respond from BLEU, ROUGE, METEOR and CIDEr assessment criteria by obtaining high quality captions.
出处 《计算机应用与软件》 北大核心 2018年第1期211-216,231,共7页 Computer Applications and Software
基金 国家自然科学基金项目(61370157)
关键词 图像文本化描述 递归神经网络 语义相似性 语言模型 语义鸿沟 束搜索 search Image caption Recursive neural network Semantic similarity Language model Semantic gap Beam
  • 相关文献

同被引文献7

引证文献2

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部