期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
引入图像信息的多模态复述生成模型
1
作者
马超
万璋
+2 位作者
张玉洁
徐金安
陈钰枫
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2022年第1期45-53,共9页
在商品描述、新闻评论等多模态场景下,已有复述生成模型只能围绕文本信息生成复述。为了解决其因无法利用图像信息而导致的语义丢失问题,提出多模态复述生成模型(multi-modalityparaphrasegeneration model,MPG)来引入图像信息,并用其...
在商品描述、新闻评论等多模态场景下,已有复述生成模型只能围绕文本信息生成复述。为了解决其因无法利用图像信息而导致的语义丢失问题,提出多模态复述生成模型(multi-modalityparaphrasegeneration model,MPG)来引入图像信息,并用其生成复述。在MPG中,为了引入与原句对应的图像信息,首先根据原句构建抽象场景图,并将与原句相关联的图像区域特征转换为场景图的结点特征。进一步地,为了利用构建好的场景图来生成语义一致的复述句,使用关系图卷积神经网络和基于图的注意力机制对图结点特征进行编码和解码。在评测阶段,提出句对相似度计算方法,从MSCOCO数据集中筛选出描述图像中相同物体的句对,并将其作为复述测试集进行评测。实验结果显示,所提出的MPG模型生成的复述拥有更好的语义忠实度,表明在多模态场景下图像信息的引入对提高复述生成质量的有效性。
展开更多
关键词
复述生成
多模态
抽象场景图
注意力机制
下载PDF
职称材料
题名
引入图像信息的多模态复述生成模型
1
作者
马超
万璋
张玉洁
徐金安
陈钰枫
机构
北京交通大学计算机与信息技术学院
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2022年第1期45-53,共9页
基金
国家自然科学基金(61876198,61976015,61976016)资助。
文摘
在商品描述、新闻评论等多模态场景下,已有复述生成模型只能围绕文本信息生成复述。为了解决其因无法利用图像信息而导致的语义丢失问题,提出多模态复述生成模型(multi-modalityparaphrasegeneration model,MPG)来引入图像信息,并用其生成复述。在MPG中,为了引入与原句对应的图像信息,首先根据原句构建抽象场景图,并将与原句相关联的图像区域特征转换为场景图的结点特征。进一步地,为了利用构建好的场景图来生成语义一致的复述句,使用关系图卷积神经网络和基于图的注意力机制对图结点特征进行编码和解码。在评测阶段,提出句对相似度计算方法,从MSCOCO数据集中筛选出描述图像中相同物体的句对,并将其作为复述测试集进行评测。实验结果显示,所提出的MPG模型生成的复述拥有更好的语义忠实度,表明在多模态场景下图像信息的引入对提高复述生成质量的有效性。
关键词
复述生成
多模态
抽象场景图
注意力机制
Keywords
paraphrase generation
multi-modality
abstract scene graph
attention mechansim
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
引入图像信息的多模态复述生成模型
马超
万璋
张玉洁
徐金安
陈钰枫
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2022
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部