期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

面向近重复文本图像检索的三分支孪生网络被引量：1

Near-duplicate document image retrieval based on three-stream convolutional Siamese network

下载PDF

导出

摘要针对传统近重复文本图像检索方法需人工事先确定近重复文本图像之间存在的变换类型,易受到人主观性影响这一问题,提出一个面向近重复文本图像检索的三分支孪生网络,能自动学习图像之间存在的各种变换。该网络输入为三元组,包括查询图像、查询图像的近重复图像以及其非近重复图像,训练时采用三元损失使得查询图像和近重复图像之间的距离小于查询图像与非近重复图像之间的距离。提出的方法在两个数据集上的mAP(mean average precision)分别达到98.76%和96.50%,优于目前已有方法。 In the traditional near-duplicate document image retrieval methods,the variations among the near-duplicate document images had to be manually identified beforehand,which can be easily influenced by human subjectivity.To solve this problem,we propose a three-stream convolutional Siamese network orienting toward the near-duplicate text-image retrieval,which can automatically learn the variation types among the near-duplicate document images.The input to this network is a triplet,consisting of a query image,its near-duplicate image,and its non-near-duplicate image.Using the triplet loss,the distance between the query image and its near-duplicate image is guaranteed to be smaller than that between the query and its non-near-duplicate image.This approach achieves promising results with the mAP of 98.76% and 96.50% on two datasets,respectively,thereby greatly outperforming the state-of-the-art near-duplicate document image retrieval methods.

作者许柏祥刘丽邱桃荣 XU Boxiang;LIU Li;QIU Taorong(School of Information Engineering,Nanchang University,Nanchang 330031,China)

机构地区南昌大学信息工程学院

出处《智能系统学报》 CSCD 北大核心 2022年第3期515-522,共8页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金青年项目(61603256).

关键词近重复文本图像图像检索三分支孪生网络三元损失函数图像变换三元组特征提取鲁棒性 near-duplicate document image image retrieval three-stream convolutional Siamese network triplet loss image variations triplet feature extraction robustness

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1方涛,陈志国,傅毅.神经网络多层特征信息融合的人脸识别方法[J].智能系统学报,2021,16(2):279-285. 被引量：8

二级参考文献5

1孙劲光,孟凡宇.基于深度神经网络的特征加权融合人脸识别方法[J].计算机应用,2016,36(2):437-443. 被引量：16
2周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1651
3景晨凯,宋涛,庄雷,刘刚,王乐,刘凯伦.基于深度卷积神经网络的人脸识别技术综述[J].计算机应用与软件,2018,35(1):223-231. 被引量：92
4吕璐,蔡晓东,曾燕,梁晓曦.一种基于融合深度卷积神经网络与度量学习的人脸识别方法[J].现代电子技术,2018,41(9):58-61. 被引量：5
5任克强,胡慧.角度空间三元组损失微调的人脸识别[J].液晶与显示,2019,34(1):110-117. 被引量：3

共引文献7

1孙燕,李旭军,何启泓.跨年龄人脸验证技术研究[J].智能系统学报,2021,16(2):247-253. 被引量：1
2徐传运,王影,王文敏,李刚,郑宇,张晴.面向生活垃圾图像分类的多级特征加权融合算法[J].重庆理工大学学报（自然科学）,2022,36(9):146-155. 被引量：4
3褚新建.基于深度可分离卷积的轻量化人脸识别方法设计[J].信息与电脑,2022,34(24):174-176.
4殷帅.基于二维主成分分析法的人脸识别技术性能分析[J].太原学院学报（自然科学版）,2023,41(3):54-58. 被引量：2
5王娟娟,宋三华,杜云明.考虑Gabor小波特征的LBFI识别仿真[J].计算机仿真,2023,40(9):237-241.
6王晨海,彭婵娟.基于机器视觉的局部遮挡人脸图像识别仿真[J].计算机仿真,2023,40(11):170-174. 被引量：1
7刘海燕,黄燕.基于智能感知的人脸细微表情情绪推定算法[J].计算机仿真,2024,41(1):201-205.

同被引文献5

1邓一姣,张凤荔,陈学勤,艾擎,余苏喆.面向跨模态检索的协同注意力网络模型[J].计算机科学,2020,47(4):54-59. 被引量：9
2董光芹,夏文秀.基于Top-k查询算法的图书自整合信息快速检索方法[J].吉林大学学报（理学版）,2020,58(3):666-670. 被引量：6
3赵鹏,马泰宇,李毅,刘慧婷.融合全模态自编码器和生成对抗机制的跨模态检索[J].计算机辅助设计与图形学学报,2021,33(10):1486-1494. 被引量：2
4胡颖杰,张秋余,李昱州.基于声母和深度哈希的密文语音全文检索方法[J].华中科技大学学报（自然科学版）,2021,49(12):83-88. 被引量：2
5陈潇,王晶晶,李寿山,韦思义,张啸宇,陈强.基于多通道BERT的跨语言属性级情感分类方法[J].中文信息学报,2022,36(2):121-128. 被引量：3

引证文献1

1齐梅,刘则芬,樊浩,李升.采用语义一致性编码网络的跨模态语音关键词检索[J].宜宾学院学报,2022,22(12):6-13. 被引量：2

二级引证文献2

1杨邦伟.基于多模态学习的图书馆图书资料关键词自动检索方法[J].信息与电脑,2024,36(4):251-253.
2孟巍,张东宁,郭腾炫,宗振国,孔鹏.基于改进关联规则算法的数据库关键词检索方法[J].移动信息,2024,46(4):274-276.

1王道累,杜文斌,刘易腾,张天宇,孙嘉珺,李明山.基于密集连接与特征增强的遥感图像检测[J].计算机工程,2022,48(6):251-256. 被引量：7
2刘立勇,马红英.青年毛泽东的读书实践[J].新湘评论,2022(12):55-55.
3李博文,贺碧芳.PVsiRNAPred-LSTM:基于长短时记忆神经网络预测植物病毒衍生的小干扰RNA[J].科技风,2022(15):71-74. 被引量：1
4张小军,许永新,庄文兵,王永强,刘杰,赵蓂冠.基于水波算法-因子分析-长短时记忆网络的重要输电通道风险评估预测[J].现代电力,2022,39(3):278-286. 被引量：2

智能系统学报

2022年第3期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部