融合语义特征和分布特征的跨媒体关联分析方法研究被引量：2

Research on Cross-media Correlation Analysis by Fusing Semantic Features and Distribution Features

下载PDF

导出

摘要文本、图像、视频、音频等多种媒体数据具有多源异构的特性,这导致“语义鸿沟”问题的出现。现有文献采用的方法中大多数是针对文本和图像两种媒体数据展开研究,难以实现更多类型媒体数据的关联分析。因此,本文融入多种媒体数据的语义特征和分布特征,来对跨媒体关联分析方法进行深入研究,以实现文本、图像、视频、音频等多种媒体数据的一致性表示。首先,对多种媒体数据进行向量化表示,并输入模型;其次,利用双向长短期记忆网络(bidirectional long short-term memory,BiLSTM)挖掘输入数据的上下文信息,得到各种媒体数据的特征向量;最后,融合特征向量的语义特征和分布特征进行跨媒体关联分析,进而得到跨媒体的一致性表示。自建数据集上的比较实验结果表明,本文的研究方法较之CCA(canonical correlation analysis)、KCCA(kernel canonical correlation analysis)、Deep-SM(deep semantic match)等已有方法具有更高的关联分析准确率,这表明本文的研究方法能够较为准确地发现各种媒体数据之间的语义关联关系。希望本文的研究对跨媒体关联分析研究具有一定的指导和借鉴作用。 Several types of media data such as text,image,video,and audio are of multi-source heterogeneous type,which leads to the problem of semantic gaps.Current researches focus mostly on text and image,presumably because it is difficult to measure the correlation between more types of media data.Therefore,we discuss performing cross-media correlation analysis by fusing the semantic features and distribution features so as to produce consistent presentation of different types of media data.The different types of media data are first vectorized and input into the proposed model.Then,bidirectional long short-term memory(BiLSTM)is utilized to extract the context information,and the feature vectors are obtained.Finally,the correlation between different types of media data is analyzed by fusing the semantic features and distribution features,and all types of media data are represented consistently.The comparative experimental results show that the method proposed in this paper performs better than several traditional methods such as CCA(canonical correlation analysis),KCCA(kernel canonical correlation analysis),and Deep-SM(deep semantic match),which indicates that the proposed method can precisely detect the semantic correlation between different types of media data.The paper offers guidance and reference for research on cross-media correlation analysis.

作者刘忠宝赵文娟 Liu Zhongbao;Zhao Wenjuan(Institute of Language Intelligence,Beijing Language and Culture University,Beijing 100083;Key Laboratory of Cloud Computing and Internet-of-Things Technology,Quanzhou University of Information Engineering,Quanzhou 362000)

机构地区北京语言大学语言智能研究院泉州信息工程学院云计算与物联网技术福建省高等学校重点实验室

出处《情报学报》 CSSCI CSCD 北大核心 2021年第5期471-478,共8页 Journal of the China Society for Scientific and Technical Information

基金国家社会科学基金一般项目“大数据环境下面向图书馆资源的跨媒体知识服务研究”(19BTQ012)。

关键词跨媒体数据关联分析双向长短期记忆网络语义特征分布特征 cross-media data correlation analysis bidirectional long short-term memory(BiLSTM) semantic features distribution features

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1李广丽,张红斌,移梦阳.数字图书馆中跨媒体检索模型的设计及优化探索[J].情报理论与实践,2013,36(2):104-108. 被引量：5
2明均仁,何超.基于语义关联挖掘的数字图书馆跨媒体检索方法研究[J].图书情报工作,2013,57(7):101-105. 被引量：14
3张兴旺,黄晓斌.数字图书馆跨媒体检索研究综述[J].情报资料工作,2014,35(3):37-42. 被引量：7
4刘忠宝,贾君枝,赵文娟.数字图书馆跨媒体检索技术研究[J].图书馆论坛,2014,34(12):94-97. 被引量：6
5李爱明.数字图书馆中基于语义关联挖掘的跨媒体检索研究:模型设计与实验分析[J].情报科学,2014,32(1):85-88. 被引量：13
6彭欣.基于深度学习的数字图书馆跨媒体语义检索方法研究[J].情报探索,2018(2):16-19. 被引量：14
7徐彤阳,邓颖慧.微信中基于语义关联的跨媒体检索研究[J].情报科学,2018,36(7):158-162. 被引量：1
8黄微,刘熠,孙悦.多媒体网络舆情语义识别的关键技术分析[J].情报理论与实践,2019,42(1):134-140. 被引量：16
9熊回香,杨滋荣,蒋武轩.跨媒体知识图谱构建中多模态数据语义相关性研究[J].情报理论与实践,2019,42(2):13-18. 被引量：22
10李广丽,朱涛,刘斌,殷依,邱蝶蝶,张红斌.面向大数据的数字图书馆多媒体信息检索系统优化研究[J].情报科学,2019,37(2):115-119. 被引量：37

二级参考文献99

1薛向阳.基于内容的多媒体和跨媒体信息检索技术[J].世界科学,2005,27(12):21-22. 被引量：4
2候杰.数字图书馆中图像信息的检索技术[J].图书馆理论与实践,2006(2):101-103. 被引量：2
3王思力,王斌.基于双字耦合度的中文分词交叉歧义处理方法[J].中文信息学报,2007,21(5):14-17. 被引量：17
4McGurk H, MacDonald J. Hearing lips and seeing voices [ J ] . Natures, 1976, 264 (5588) : 746 - 748.
5Agrawal R, Imielinski T, Swami A. Mining association rules between sets of items in large databases [ C ]//Proceedings. of the ACM SIGMOD Conference on Management of Data. New York : ACM Press, 1993:207-216.
6吴飞,杨易,庄越挺.跨媒体分析与检索[J].中国计算机学会通讯,2011,7(2):22-26.
7Lemaire B, Denhiere G. Effect of high-order co-occurrences on word semantic similarities [OL].[ 2012 - 02 - 12 ]. http://cpl. revues, org/document471, html.
8甘明鑫,窦雪,王道平,等.一种综合加权的本体概念语义相似度计算方法[OL].[2012-02-16].http://www.cnki.net/kcms/detail/11.2127.tD.20110725.1625.046.html.
9Wu Zhibiao, Palmer M. Verb senmntics and lexical selection [ C]// Proceedings of the 32nd Computational Linguistics. Linguistics, 1994:133-138 Annual Meeting on Association for Stroudsburg Association for Computational.
10Michael S Lew, Nicu Sebe, Chabane Djeraba. Con- tent-based Multimedia Information Retrieval: State of the Art and Challenges [J]. ACM Transactions on Mul- timedia Computing, 2006, 2(1): 1-19.

共引文献106

1陈财森,向阳霞,寇应展,刘会英.面向装备作战数据的知识图谱平台构建[J].装甲兵学报,2022(5):105-110. 被引量：1
2黄微,刘熠,郭苏琳.网络舆情受众失范行为靶向引导的技术框架构建[J].知识管理论坛,2020(3):159-174. 被引量：1
3安子栋,敬卿,郝志超,余奕.基于生成式AI技术的图书馆文献资源管理创新策略[J].图书馆工作与研究,2023(S01):9-16. 被引量：12
4于岩,朱鹏威.“互联网+”环境下基于手机终端的高校移动学习模式研究[J].情报科学,2020,0(2):125-128. 被引量：28
5杨月.数字图书馆交互式信息分类检索模型设计[J].科技通报,2021,37(12):112-116. 被引量：2
6王海涛,周秉鑫.基于社交软件的高校校园网络舆情分析[J].电信快报,2021(11):13-16. 被引量：1
7程超,杨力,陈嘉鑫.融合语义关联挖掘的文本情感分析算法研究[J].硅谷,2013,6(13):73-73. 被引量：1
8任玉珍.基于普适计算技术的数字图书馆检索模型设计[J].中国科技信息,2013(24):106-107.
9吕元智.数字档案资源跨媒体语义检索实现框架与关键问题研究[J].档案学研究,2014(2):65-70. 被引量：8
10张兴旺,黄晓斌.数字图书馆跨媒体检索研究综述[J].情报资料工作,2014,35(3):37-42. 被引量：7

同被引文献26

1张志威,王国仁,徐建良,杜小勇.区块链的数据管理技术综述[J].软件学报,2020(9):2903-2925. 被引量：66
2熊回香,薛姣,李青维,夏佩.视频信息的对象关联交叉检索研究[J].图书情报工作,2011,55(S2):295-299. 被引量：1
3聂鑫.我国书目信息标准化工作发展述略[J].情报科学,2004,22(8):982-984. 被引量：3
4沈静,周金治,马建国.基于UCL的网页信息自动标引技术研究[J].现代图书情报技术,2008(8):58-62. 被引量：7
5刘润达,彭洁,涂勇.一种多维关键词与分类关联的科学数据资源分类导航平台构建方案[J].现代图书情报技术,2010(9):74-78. 被引量：6
6杜琳,陈云亮,朱静.图像数据挖掘研究综述[J].计算机应用与软件,2011,28(2):125-128. 被引量：6
7徐志华,周金治,李莲春.基于UCL的网络音视频自动标引[J].电视技术,2011,35(12):87-89. 被引量：2
8于倩倩.专著内容索引的编制方法探析——以《情报检索语言与智能信息处理丛书》为例[J].图书馆学研究,2012(19):36-42. 被引量：3
9李战怀,王国仁,周傲英.从数据库视角解读大数据的研究进展与趋势[J].计算机工程与科学,2013,35(10):1-11. 被引量：53
10唐京春,张新新.专业出版大数据建设路径分析[J].科技与出版,2019(1):59-63. 被引量：4

引证文献2

1董晶,张体中,韩国权,廉园园,何晓辉,王霄,吴彦霓.司法电子卷宗跨组织协同处理平台关键技术研究[J].信息技术与标准化,2022(3):25-31.
2彭贤哲,郑建明,李佳新,石进.目录学思想在数据结构化过程的传承与应用[J].图书情报知识,2024,41(1):80-91.

1王君,黄宁,陈楷升,何新宇,梁世亮,梁薇薇.基于KCCA的煤矿人员特征融合识别[J].计算机技术与发展,2021,31(2):101-105. 被引量：5

情报学报

2021年第5期

浏览历史

内容加载中请稍等...

融合语义特征和分布特征的跨媒体关联分析方法研究被引量：2

参考文献10

二级参考文献99

共引文献106

同被引文献26

引证文献2

相关作者

相关机构

相关主题

浏览历史

融合语义特征和分布特征的跨媒体关联分析方法研究 被引量：2

参考文献10

二级参考文献99

共引文献106

同被引文献26

引证文献2

相关作者

相关机构

相关主题

浏览历史

融合语义特征和分布特征的跨媒体关联分析方法研究被引量：2