-
题名基于关键词精化和句法树的商品图像句子标注
被引量:5
- 1
-
-
作者
张红斌
姬东鸿
尹兰
任亚峰
牛正雨
-
机构
武汉大学计算机学院
华东交通大学软件学院
贵州师范大学大数据与计算机科学学院
百度在线网络技术(北京)有限公司
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2016年第11期2542-2555,共14页
-
基金
国家自然科学基金项目(61133012)
国家社会科学基金重大招标项目(11&ZD189)
+6 种基金
教育部人文社科基金项目(16YJAZH029)
江西省科技厅科技攻关项目(20121BBG70050
20142BBG70011)
江西省高校人文社科基金项目(XW1502
TQ1503)
江西省普通本科高校中青年教师发展计划访问学者专项资金
江西省社科规划项目(16TQ02)~~
-
文摘
商品图像句子标注是图像标注中一项既有趣又富有挑战的研究任务.噪声单词干扰和句法结构错误是该项研究的制约因素,针对噪声单词干扰,提出关键词精化思想:用绝对排序特征强化关键词权重,完成第1次关键词精化;计算单词的语义相关度评分,进一步优选能准确刻画图像内容的单词,完成第2次关键词精化.设计词序列"拼积木"算法,把关键词拼装成N元词序列.针对句法结构错误,提出句法树思想:基于N元词序列和句法子树递归地构建一棵完整的句法树,遍历该树叶子结点输出句子,标注商品图像.实验结果表明:关键词精化和句法树均有助于改善标注性能,句中的语义信息兼容性和句法模式兼容性得以保持,句子内容更连贯、流畅.
-
关键词
图像标注
商品图像
句子标注
关键词精化
句法树
词序列“拼积木”
N元词序列
自然语言生成
-
Keywords
image annotation
product image
caption generation
tag refinement(TR)
syntactic tree(ST)
word sequence blocks building
Ngram word sequence
natural language generation(NLG)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-