中文多模态知识库构建被引量：2

Construction of Chinese Multimodal Knowledge Base

下载PDF

导出

摘要多模态融合旨在将多个模态信息整合以得到一致、公共的模型输出,是多模态领域的一个基本问题。通过多模态信息的融合能获得更全面的特征并且提高模型鲁棒性,目前多模态融合技术已成为多模态领域核心研究课题之一。本文基于ImageNet、HowNet和CCD,通过人工标注构建了一个新的多模态知识库,已完成校准ImageNet中21455个名词及动词概念的映射,有效地将HowNet以及CCD中概念映射到ImageNet中。该数据集能够应用于自然语言处理任务和计算机视觉任务,并通过图片信息和概念信息提高任务效果。在图片分类中,通过增加HowNet和ImageNet概念能够融合更多的图片特征来辅助分类;在语义理解中,通过映射增加图片信息可以更好地理解语义。 Multi-modal fusion aims to integrate multiple modal information to obtain a consistent and common model output,which is a basic problem in the multi-modal field.Through the fusion of multimodal information,more comprehensive features can be obtained and the robustness of the model can be improved.At present,multimodal fusion technology has become one of the core research topics in the field of multimodality.Based on Imagenet,HowNet and CCD,this paper constructs a new multimodal knowledge base through manual annotation.The calibration has completed the mapping of 21455 noun concepts in ImageNet,effectively mapping the concepts in HowNet and CCD to ImageNet.The data set can be applied to natural language processing tasks and computer vision tasks,and improve the task effect through picture information and concept information.In image classification,by adding HowNet and ImageNet concepts,more image features can be integrated to assist classification.In semantic understanding,image information can be better understood by adding image information through mapping.

作者晁睿张坤丽王佳佳胡斌张维聪韩英杰昝红英 CHAO Rui;ZHANG Kunli;WANG Jiajia;HU Bin;ZHANG Weicong;HAN Yingjie;ZAN Hongying(School of Computer and Artificial Intelligence,Zhengzhou University,Zhengzhou Henan 450001,China)

机构地区郑州大学计算机与人工智能学院

出处《广西师范大学学报（自然科学版）》 CAS 北大核心 2022年第3期31-39,共9页 Journal of Guangxi Normal University:Natural Science Edition

基金国家重点研发计划(2017YFB1002101) 国家社科基金重大项目(17ZDA138) 国家自然科学基金(62006211) 河南省科技攻关项目(192102210260) 河南省高等学校重点科研项目(19A520003,20A520038) 教育部人文社科规划项目(20YJA740033)。

关键词多模态信息多模态融合 ImageNet HOWNET CCD multimodal infomation multimodal fusion ImageNet HowNet CCD

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1陈鹏,李擎,张德政,杨宇航,蔡铮,陆子怡.多模态学习方法综述[J].工程科学学报,2020,42(5):557-569. 被引量：28
2董振东,董强.知网和汉语研究[J].当代语言学,2001,3(1):33-44. 被引量：57
3刘扬,俞士汶,于江生.CCD语义知识库的构造研究[J].小型微型计算机系统,2005,26(8):1411-1415. 被引量：9
4赵京胜,宋梦雪,高祥.自然语言处理发展及应用综述[J].信息技术与信息化,2019(7):142-145. 被引量：77
5李霞,卢官明,闫静杰,张正言.多模态维度情感预测综述[J].自动化学报,2018,44(12):2142-2159. 被引量：26
6孙影影,贾振堂,朱昊宇.多模态深度学习综述[J].计算机工程与应用,2020,56(21):1-10. 被引量：33
7邓佩,谭长庚.基于转移变量的图文融合微博情感分析[J].计算机应用研究,2018,35(7):2038-2041. 被引量：7

二级参考文献47

1黄波,刘传才.基于加权TextRank的中文自动文本摘要[J].计算机应用研究,2020,37(2):407-410. 被引量：21
2徐通锵.“字”和汉语语义句法的生成机制[J].语言文字应用,1999(1):24-34. 被引量：52
3董振东.语义关系的表达和知识系统的建造[J].语言文字应用,1998(3):79-85. 被引量：59
4陈群秀.一个在线义类词库:词网 WordNet[J].语言文字应用,1998(2):95-101. 被引量：31
5张普.中文信息处理专题研究主持人的话[J].语言文字应用,2000(2):40-41. 被引量：5
6Fellbaum C. Wordnet: An electronic lexical database [M].Cambridge, Mass. : MIT Press,1999.
7董振东董强.知网简介[EB／OL].http://www.keenage.com/.,1999.
8Vossen P. EuroWordnet: A multilingual database with lexical semantic networks[M]. Dordrecht :Kluwer, 1998.
9Pianta P, Pala K. VisDic - a new tool for wordnet editing[C].ICGW' 02, India, 2002.
10于江生俞士汶.CCD的结构与设计思想[J].中文信息学报,2002,4.

共引文献227

1赵智慧,周毅,李炜弘,汤朝晖,郭强,陈日高.基于深度学习多模态融合的2型糖尿病中医证素辨证模型的构建[J].世界科学技术-中医药现代化,2024,26(4):908-918. 被引量：1
2贾超,常永才.如何将新媒体技术深度整合到民族地区国家通用语言文字教育——基于多重读写教育观的启示[J].青海民族研究,2022,33(2):91-96. 被引量：7
3吴婷,李明扬,孔芳.基于同义推理的篇章级实体上下位关系语料库构建[J].中文信息学报,2020(4):38-46. 被引量：1
4李明琴,李涓子,王作英,陆大.中文语义依存关系分析的统计模型(英文)[J].计算机学报,2004,27(12):1679-1687. 被引量：9
5傅爱平.黏合式名词短语结构关系的考察和分析[J].中国语文,2004(6):508-520. 被引量：8
6安华林.现代汉语释义基元词探索[J].甘肃高师学报,2004,9(6):38-41.
7郑鑫,秦建军,陈汉辉,李伟宏.基于可拓学的自然语言处理与系统建模研究[J].哈尔滨工业大学学报,2006,38(7):1209-1212. 被引量：5
8耿增民,刘万春,朱玉文.受限领域的自动文摘方法研究[J].北京理工大学学报,2006,26(8):712-715. 被引量：1
9罗进军.当前计算语言学研究的发展态势[J].湖南工业职业技术学院学报,2006,6(4):105-107.
10王奕首,滕弘飞,金博,屈福政.实现中小企业产品设计重用的若干途径[J].计算机工程与应用,2007,43(9):88-91. 被引量：1

同被引文献15

1吕叔湘.大家来关心新词新义[J].辞书研究,1984(1):8-14. 被引量：97
2亢世勇.《现代汉语新词语信息(电子)词典》的开发与应用[J].辞书研究,2001(2):55-63. 被引量：11
3张德禄,王璐.多模态话语模态的协同及在外语教学中的体现[J].外语学刊,2010(2):97-102. 被引量：410
4周荐,曾柱.新词语与语文教学——周荐访谈录[J].语文教学与研究（教研天地）,2010(6):6-9. 被引量：2
5刘善涛,李敏,亢世勇.对外汉语新词教学信息库的研究与实现[J].语言文字应用,2011(1):129-134. 被引量：8
6周强,王俊俊,陈丽欧.构建大规模的汉语事件知识库[J].中文信息学报,2012,26(3):86-91. 被引量：2
7刘华,方沁.汉语教学用话题库及话题分类影视资源库构建[J].世界汉语教学,2014,28(3):378-392. 被引量：25
8石金铭,昝红英,韩英杰.大规模汉语词汇语义知识库的构建[J].山西大学学报（自然科学版）,2015,38(4):581-587. 被引量：2
9陈桂林,马胜,郭阳,李艺煌,徐睿.通过K-means算法实现神经网络的加速和压缩[J].计算机工程与科学,2019,41(5):796-803. 被引量：3
10洪炜,刘欣慰.图文双模态释义对汉语二语词汇学习的影响[J].语言教学与研究,2019(4):23-32. 被引量：4

引证文献2

1郑瑾,安文有.基于深度学习的轻量级图像分类网络探究[J].黄冈职业技术学院学报,2024,26(2):98-102.
2亢世勇,王兴隆.面向中文学习的现代汉语新词语融媒体知识库构建研究[J].枣庄学院学报,2024,41(3):63-69.

1李文巍,严立明.高考历史选择题信息聚合的逻辑进路[J].教学考试,2022(28):54-56.
2宋培彦,刘稚楠,刘冰.基于ISO 25964的公共卫生领域术语语义映射机制研究[J].图书与情报,2021(5):31-38.
3陈瑞,曾建勋.叙词表集成化体系及应用推进研究[J].情报学报,2022,41(4):401-411.

广西师范大学学报（自然科学版）

2022年第3期

浏览历史

内容加载中请稍等...

中文多模态知识库构建被引量：2

参考文献7

二级参考文献47

共引文献227

同被引文献15

引证文献2

相关作者

相关机构

相关主题

浏览历史

中文多模态知识库构建 被引量：2

参考文献7

二级参考文献47

共引文献227

同被引文献15

引证文献2

相关作者

相关机构

相关主题

浏览历史

中文多模态知识库构建被引量：2