期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多模深度神经网络生成图像描述研究
1
作者 周珊 刘子龙 《软件导刊》 2018年第8期40-44,共5页
图片相比文字而言,可以为人们呈现更生动、更易于理解和更丰富的信息,海量图片成为互联网信息交流的主要媒介之一。因此,如何快速、便捷地自动生成图像描述具有研究意义。介绍了一种根据图像生成其内容的自然语言描述模型,该模型是基于... 图片相比文字而言,可以为人们呈现更生动、更易于理解和更丰富的信息,海量图片成为互联网信息交流的主要媒介之一。因此,如何快速、便捷地自动生成图像描述具有研究意义。介绍了一种根据图像生成其内容的自然语言描述模型,该模型是基于一种在图像区域上应用改进的Faster-RCNN、在句子上应用BRNN以及通过多模嵌入达成两种模态对齐的一种结构化目标的新颖组合。对实验生成描述与图片本来描述相似度进行评估,B-1为0.63,B-2为0.45,B-1为0.32,相较于初始的一些语言描述模型性能有明显提高,说明该模型有一定的实用性。 展开更多
关键词 自然语言描述 改进Faster-RCNN BRNN 多模嵌入 态对齐
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部