期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
体现用户意图和风格的图像描述生成
1
作者
王宇航
张灿龙
+1 位作者
李志欣
王智文
《广西师范大学学报(自然科学版)》
CAS
北大核心
2022年第4期91-103,共13页
现有的图像描述模型大多不能根据用户的意图和用语风格生成个性化的描述。针对这一问题,本文提出一种能体现用户意图和风格的个性化图像描述方法。首先,构建一个关于场景中目标、目标属性以及目标间关系的结构图,通过该图来控制用户所...
现有的图像描述模型大多不能根据用户的意图和用语风格生成个性化的描述。针对这一问题,本文提出一种能体现用户意图和风格的个性化图像描述方法。首先,构建一个关于场景中目标、目标属性以及目标间关系的结构图,通过该图来控制用户所希望表达的目标对象、目标属性以及各目标之间的相互关系;然后,在编码器中加入多关系图卷积神经网络对场景的上下文信息进行编码,并利用图流动注意力来控制描述的侧重点;最后,在生成语句时加入用户风格控制模块,即利用关键词搜索生成包含性别、年龄、受教育程度等信息的用户画像,并结合该画像来控制风格生成器,提取对应的风格样式,最终生成体现用户意图和风格的个性化图像描述。在MSCOCO和FlickrStyle数据集上的实验结果表明,所提出的方法能较好地生成个性化和多样性图像描述语句。
展开更多
关键词
图像描述
用户画像
细粒度场景控制
风格
控制
注意力机制
下载PDF
职称材料
题名
体现用户意图和风格的图像描述生成
1
作者
王宇航
张灿龙
李志欣
王智文
机构
广西多源信息挖掘与安全重点实验室(广西师范大学)
广西科技大学计算机科学与通信工程学院
出处
《广西师范大学学报(自然科学版)》
CAS
北大核心
2022年第4期91-103,共13页
基金
国家自然科学基金(61866004,61966004,61962007)
广西自然科学基金(2018GXNSFDA281009,2019GXNSFDA245018,2018GXNSFDA294001)
+1 种基金
广西多源信息挖掘与安全重点实验室系统性研究课题基金(20-A-03-01)
广西“八桂学者”创新研究团队。
文摘
现有的图像描述模型大多不能根据用户的意图和用语风格生成个性化的描述。针对这一问题,本文提出一种能体现用户意图和风格的个性化图像描述方法。首先,构建一个关于场景中目标、目标属性以及目标间关系的结构图,通过该图来控制用户所希望表达的目标对象、目标属性以及各目标之间的相互关系;然后,在编码器中加入多关系图卷积神经网络对场景的上下文信息进行编码,并利用图流动注意力来控制描述的侧重点;最后,在生成语句时加入用户风格控制模块,即利用关键词搜索生成包含性别、年龄、受教育程度等信息的用户画像,并结合该画像来控制风格生成器,提取对应的风格样式,最终生成体现用户意图和风格的个性化图像描述。在MSCOCO和FlickrStyle数据集上的实验结果表明,所提出的方法能较好地生成个性化和多样性图像描述语句。
关键词
图像描述
用户画像
细粒度场景控制
风格
控制
注意力机制
Keywords
image captioning
user profile
fine-grained control
style control
attention mechanism
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
体现用户意图和风格的图像描述生成
王宇航
张灿龙
李志欣
王智文
《广西师范大学学报(自然科学版)》
CAS
北大核心
2022
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部