-
题名一种基于深度学习的中文图像描述模型
被引量:4
- 1
-
-
作者
郭淑涛
赵德新
-
机构
天津理工大学计算机科学与工程学院
-
出处
《天津理工大学学报》
2020年第3期30-35,共6页
-
基金
国家自然科学基金(61571328).
-
文摘
近年来编码器和解码器组成的深度神经网络在图像描述任务中取得了很好的表现,一般编码器采用深度卷积神经网络,解码器采用循环神经网络.针对循环神经网络存在的梯度消失问题,在图像描述任务中表现为循环神经网络后续时间片生成的单词缺乏先前的信息引导,提出了记忆助手的方法,并给出了一种面向大规模中文数据集的多模态神经网络模型.该模型采用深度卷积神经网络(Inception-v4、Inception-ResNet-v2)和注意力机制提取图像视觉特征,在循环神经网络中引入记忆助手来引导句子的生成.实验证明,在AI CHALLENGER测试集中,这种模型显著地提高了各项评价指标.
-
关键词
中文图像描述
深度学习
卷积神经网络
递归神经网络
-
Keywords
Chinese image caption
deep learning
convolutional neural networks
recurrent neural networks
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名密集场景下的人流密度统计方法研究综述
- 2
-
-
作者
郭淑涛
韩琳
-
机构
公安部第一研究所
-
出处
《机电产品开发与创新》
2022年第6期162-165,169,共5页
-
文摘
密集场景下的人流密度统计方法的研究是一项近年来出现的计算机视觉领域的具有挑战性的难题,密集人群有人数多,人群分布情况复杂的特点。该课题结合深度学习技术后,取得了一定程度的研究进展。当前该领域研究方法可以归纳为两大类:一类是基于回归的人数统计方法研究,另一类是基于检测的人数统计方法研究。本文对两大类方法分别进行了系统的归纳总结,整理了目前常用的数据集和对应的评价指标,并比较各个数据集之间的特点,总结该课题当前存在的问题和研究难点,展望未来的研究趋势。
-
关键词
深度学习
密集场景
人流密度
-
Keywords
Deep learning
Dense scenes
Crowd density
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-