卷积神经网络在跨媒体检索中的应用研究被引量：3

Application of convolutional neural network in cross media retrieval

下载PDF

导出

摘要为了适应人们多样化的检索需求,国内外研究人员提出各种＂浅层＂学习方法模型来探索跨媒体数据间潜在的关联关系,但这些方法主要从手工构建的底层特征出发,并不能充分有效的学习到不同媒体间的关联。与手工构建底层特征不同,深度学习通过无监督逐层预训练与有监督的微调,从而实现区分性更强的特征描述。利用深度学习在特征学习方面的优越性,提出了一种基于深层卷积神经网络VGGNet与LDA模型相结合的跨媒体数据检索方法,该方法利用预训练的VGGNet模型提取图像视觉特征,同时使用LDA模型获取文本的主题概率分布,有效的缩减了不同模态数据间的异构鸿沟与语义鸿沟,从而更有效的实现文本与图像之间的跨媒体检索,实验证明了该方法的先进性和有效性。 In order to meet the diversified retrieval needs of people,researchers at home and abroad put forward various＂shallow＂learning method models to explore the potential correlation between cross-media data.However,these methods mainly start from the bottom features of manual construction,which can not fully and effectively learn the association between different media.Different from the underlying features of manual construction,deep learning is accomplished through unsupervised layer-by-layer pre-training and supervised fine-tuning,to achieve a stronger discriminative feature description.Takes advantage of the superiority of deep learning in feature learning,we proposes a cross-media data retrieval method based on deep convolutional neural network VGGNet and LDA model.The method uses the pretrained VGGNet model to extract visual features of the images and uses the LDA model to obtain the thematic probability distribution of the texts,which effectively reduces the heterogeneous and semantic gap between different modal data.Thus,the cross-media retrieval between text and image can be realized more effectively.In this paper,experiments are conducted to demonstrate the progressiveness and effectiveness of the method which I proposed.

作者金汉均段贝贝 Jin Hanjun;Duan Beibei(School of Computer, Central China Normal University, Wuhan 430079, Chin)

机构地区华中师范大学计算机学院

出处《电子测量技术》 2018年第7期54-57,共4页 Electronic Measurement Technology

基金教育部人文社科规划基金(17YJA870010)项目资助

关键词跨媒体检索深度学习卷积神经网络 VGGNet cross media retrieval deep learning convolutional neural network VGGNet

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1张磊,赵耀,朱振峰.跨媒体语义共享子空间学习研究进展[J].计算机学报,2017,40(6):1394-1421. 被引量：14
2吴飞,朱文武,于俊清.多媒体技术研究：2014--深度学习与媒体计算[J].中国图象图形学报,2015,20(11):1423-1433. 被引量：14
3蔡平,王志强,傅向华.基于语义的跨媒体信息检索技术研究[J].微电子学与计算机,2010,27(3):102-105. 被引量：14
4金汉均,曾婷.小波变换在HSV颜色空间上的图像检索应用研究[J].电子测量技术,2016,39(7):106-109. 被引量：10
5刘启华.基于LDA的文本语义检索模型[J].情报科学,2014,32(8):38-43. 被引量：9
6王振振,何明,杜永萍.基于LDA主题模型的文本相似度计算[J].计算机科学,2013,40(12):229-232. 被引量：98

二级参考文献107

1王燕.一种改进的K-means聚类算法[J].计算机应用与软件,2004,21(10):122-123. 被引量：9
2袁薇,高淼.综合语义与颜色特征的图像检索技术研究[J].微电子学与计算机,2006,23(1):36-39. 被引量：4
3宋丹,王卫东,陈英.基于改进向量空间模型的话题识别与跟踪[J].计算机技术与发展,2006,16(9):62-64. 被引量：23
4廖玲,文敦伟.基于改进向量空间模型的邮件分类[J].计算机与数字工程,2007,35(4):190-193. 被引量：3
5Zhuang Yueting, Yang Yi, Wu Fei. Mining semantic correlation of heterogeneous multimedia data for cross - media retrieval[J]. IEEE Transactions on Multimedia, 2008,10 (2) : 221 - 229.
6Ahmet Ekin, Murat Tekalp A, Rajiv Mehrotra. Integrated semantic - syntactic video modeling for search and browsing[J]. IEEE Transactions on Multimedia, 2004,6 (6) : 839 - 851.
7Umapathy K, Krishnan S, Jimaa S. Multigroup classification of audio signals using time- frequency parameters[J ]. IEEE Transactions on Multimedia, 2005, 7 ( 2 ) : 308 - 315.
8Salton G,Wong A, Yang C S. A Vector Space Model for Auto- matic lndexing[J]. Communications of the ACM, 1975,18: 613- 620.
9Blei D, Ng A, Jordan M. Latent dirichlet allocation[J]. Journal of Machine Learning Research, 2003,3 : 993.
10石晶,范猛,李万龙.基于LDA模型的主题分析[J].自动化报,2009,36:1586-1593.

共引文献151

1李飞跃,宋佳霏.基于文本相似度分析的《红楼梦》化用唐诗研究[J].中外文化与文论,2024(2):213-228. 被引量：1
2孟旭,谢靖,李春旺.基于核心主题特征的作者身份识别研究[J].知识管理论坛,2023(5):351-364.
3金丹,张娇娇,李依玲,崔立新.一种改进的协同过滤算法研究——以电影推荐系统为例[J].国际商务（对外经济贸易大学学报）,2020,0(1):128-141. 被引量：6
4唐浩哲,黄源源,任震宇,成江宇,李朝荣.基于DNA编码和二维混沌系统的图像加密算法[J].成都信息工程大学学报,2022,37(5):485-493.
5张荣勤.高校图书馆学士学位论文网上提交管理系统的设计与实现[J].农业图书情报学刊,2011,23(8):41-44. 被引量：2
6罗俊丽,李慧娜,路凯.基于词义消歧的语义查询扩展研究[J].微电子学与计算机,2012,29(1):71-75. 被引量：3
7明均仁,何超.基于语义关联挖掘的数字图书馆跨媒体检索方法研究[J].图书情报工作,2013,57(7):101-105. 被引量：14
8李兴春.信息检索技术中基于语义的扩展查询研究[J].重庆师范大学学报（自然科学版）,2013,30(4):113-116. 被引量：6
9吕元智.数字档案资源跨媒体语义检索实现框架与关键问题研究[J].档案学研究,2014(2):65-70. 被引量：8
10张兴旺,黄晓斌.数字图书馆跨媒体检索研究综述[J].情报资料工作,2014,35(3):37-42. 被引量：7

同被引文献26

1王上飞,薛佳,王煦法.基于内容的情感图像获取模型[J].计算机科学,2004,31(9):186-190. 被引量：6
2黄崑,赖茂生.以用户情感为线索的图像检索研究[J].情报科学,2006,24(9):1395-1399. 被引量：7
3成琳,陈俊杰,相洁.图像颜色征提取技术的研究与应用[J].计算机工程与设计,2009,30(14):3451-3454. 被引量：13
4黄崑,骆方,游祎.图像情感特征及其检索应用[J].情报科学,2010,28(4):602-606. 被引量：8
5王彦林.基于HSV颜色特征图像检索算法在Matlab中的实现[J].电脑编程技巧与维护,2013(16):86-87. 被引量：6
6冯思为,陈蕾,王加俊.一种自适应特征分块加权的图像检索方法[J].计算机技术与发展,2014,24(2):29-33. 被引量：2
7陈静,陈德照,陆泉.一种基于表情分析的图像用户兴趣提取模型[J].情报理论与实践,2014,37(5):92-96. 被引量：1
8李学龙,史建华,董永生,陶大程.场景图像分类技术综述[J].中国科学：信息科学,2015,45(7):827-848. 被引量：32
9武频,陶聪,朱永华,颜宏杰,高宏浩.基于情感语义的图像注释与检索[J].计算机技术与发展,2015,25(10):13-18. 被引量：5
10马松岳,许鑫.基于评论情感分析的用户在线评价研究——以豆瓣网电影为例[J].图书情报工作,2016,60(10):95-102. 被引量：38

引证文献3

1金汉均,吴静.基于深度柯西哈希的图像检索研究[J].电子测量技术,2020(9):104-108. 被引量：1
2李志义,许洪凯,段斌.基于深度学习CNN模型的图像情感特征抽取研究[J].图书情报工作,2019,63(11):96-107. 被引量：23
3刘逸,应捷,陈明玺.基于深度学习的多类道路场景感知[J].电子测量技术,2019,42(11):118-121. 被引量：3

二级引证文献27

1尹朝.基于内容生成与特征提取的图像情感识别模型研究[J].系统仿真技术,2023,19(2):141-147.
2单凯强,桑海峰.基于全景视频下标记点特征的停车位检测技术研究[J].电子测量与仪器学报,2022,36(2):203-210. 被引量：5
3杨松,刘佳欣,吴桐.基于深度特征和注意力机制的艺术图像情感分类研究[J].智能计算机与应用,2022,12(2):126-132. 被引量：1
4杨松,刘佳欣,潘建达.基于融合特征和迁移学习的艺术图像情感识别研究[J].智能计算机与应用,2022,12(1):146-154.
5张幸,赵文仓,王旭.基于自适配归一化的改进Mask Scoring R-CNN[J].电子测量技术,2020,43(6):93-98. 被引量：1
6范梦余,张辉,陈怡宁.内蒙古视觉旅游形象的时空感知研究——基于DeepSentiBank的地理标记照片分析[J].干旱区资源与环境,2020,34(10):194-200. 被引量：21
7吴天强,王义贺.基于改进深度学习自编码的图像边沿畸变校正算法研究[J].光电子．激光,2021,32(2):149-156. 被引量：2
8颜佳,杨敏,彭梅.面向数字人文的图像数据基础设施建设研究——以我国图博档领域为视角[J].图书馆,2021(5):51-58. 被引量：12
9金汉均,曾星.基于注意力机制的深度哈希图像检索方法[J].电子测量技术,2021,44(3):144-148. 被引量：4
10张俊豪,罗国富,杨幸博,李亚为,张宁波.基于深度学习和机器视觉的多源数据感知技术研究[J].河南理工大学学报（自然科学版）,2021,40(4):107-113. 被引量：10

1徐彤阳,邓颖慧.微信中基于语义关联的跨媒体检索研究[J].情报科学,2018,36(7):158-162. 被引量：1
2张国栋.基于深度学习的图像特征学习和分类方法的研究及应用[J].网络安全技术与应用,2018(7):52-53. 被引量：1
3范文静.基于深度学习视角的英语教学模式反思[J].石家庄职业技术学院学报,2018,30(3):78-80. 被引量：5
4曾莉.基层土地确权档案管理工作的思考[J].吉林农业,2018(6):112-112. 被引量：2
5潘少芬.走向深度学习——关于高中语文教学的一点思考[J].文理导航,2018,0(10):4-5. 被引量：1
6王子一,商琳.基于子段距离计算的时间序列分类方法[J].小型微型计算机系统,2018,39(7):1386-1389. 被引量：5
7冉昊.财产权的历史变迁[J].中外法学,2018,30(2):379-392. 被引量：38
8赵小艳,刘宏哲,袁家政,杨少鹏.图像重排序技术的研究进展[J].计算机科学,2018,45(5):15-23. 被引量：1
9孟凡坤,宋世远,钱述鹏,熊刚.新型柴油氧化安定性快速评定仪器的研制[J].自动化与仪表,2018,33(6):86-91.
10李鹦.高职院校“双师”素质教师工作量制度优化研究[J].南京工业职业技术学院学报,2018,18(2):81-84. 被引量：2

电子测量技术

2018年第7期

浏览历史

内容加载中请稍等...

卷积神经网络在跨媒体检索中的应用研究被引量：3

参考文献6

二级参考文献107

共引文献151

同被引文献26

引证文献3

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

卷积神经网络在跨媒体检索中的应用研究 被引量：3

参考文献6

二级参考文献107

共引文献151

同被引文献26

引证文献3

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

卷积神经网络在跨媒体检索中的应用研究被引量：3