用于信息检索的句子级深度关联匹配模型被引量：1

Sentence Level Deep Relevance Matching Model for Information Retrieval

下载PDF

导出

摘要信息检索(information retrieval,IR)一直是自然语言处理(natural language processing,NLP)中的研究热点,随着深度学习在NLP任务中的不断发展,研究者尝试使用神经信息检索模型成功捕获了查询与待检索文档之间的关联匹配信息,但是现有的工作通常是以词为单位做关联匹配,没有充分考虑词序以及词的上下文信息,无法解决语句中可能存在的一词多义问题。为了获取查询与待检索文档之间的深层交互信息,对句子级深度关联匹配模型进行了研究,以相对于词来说语义更加完整的句子为单位对查询和待检索文档进行切分,对每一个查询句,计算与待检索文档中每个句子的相似度得分并按照相似度等级映射成固定长度的局部关联匹配直方图,使用前馈匹配网络学习层次匹配信息为每个查询句计算一个匹配分数,门控网络聚合全部查询句的匹配分数以获取最终查询-文档对的相似度得分。在Med数据集上的实验结果表明,句子级深度关联匹配模型较传统的检索模型以及一些无监督句子级检索模型能有效提高检索性能。 Information retrieval has always been a hot issue in natural language processing.In recent years,deep learning has led to exciting breakthroughs in NLP tasks,with its continuous development,researchers have tried to use neural information retrieval model to successfully capture the relevance matching information between queries and documents to be retrieved.However,the existing work usually carries out relevance matching at the word level,without giving full consideration to word order and the semantic relations between words.In order to obtain the deep interaction information between query and documents to be retrieved,a deep relevance matching model at sentence level is studied,the query and the documents to be retrieved are segmented by sentences that are semantically more complete than words,for each query sentence,mapping the variable-length local interaction into a fixed-length matching histogram according to the level of the similarity.Then a feed-forward neural matching network and a term gating network are used to obtain the final similarity score between the query and the document pairs.Experimental results on the MED dataset show that the proposed model outperforms some traditional retrieval model as well as unupervised sentence level models.

作者田媛郝文宁陈刚靳大尉邹傲 TIAN Yuan;HAO Wen-ning;CHEN Gang;JIN Da-wei;ZOU Ao(School of Command&Control Engineering,Army Engineering University of PLA,Nanjing 210001,China)

机构地区陆军工程大学指挥控制工程学院

出处《计算机技术与发展》 2022年第6期9-14,20,共7页 Computer Technology and Development

基金国家自然科学基金(61806221)。

关键词信息检索句子级深度关联匹配前馈匹配网络门控网络 information retrieval sentence level deep relevance matching feed-forward neural network gating network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1左家莉,王明文,吴水秀,万剑怡.结合句子级别检索的信息检索模型[J].中文信息学报,2016,30(2):107-112. 被引量：6
2李宇,刘波.文档检索中文本片段化机制的研究[J].计算机科学与探索,2020,14(4):578-589. 被引量：4

二级参考文献21

1Christopher D. Manning, Prabhakar Raghavan, Hin- rich Schutze. Introduction to Information retrieval ~-M]. Cambridge:Cambridge University Press, 2009.
2Gerard Salton. Automatic Information Organization and Retrieval[M]. New York: McGraw-Hill, 1968.
3Gerad Salton, Anita Wong, Chung-Shu Yang. A Vec tor Space Model for Automatic Indexing[J]. Commu- nications of the ACM, 1975, 18(11):613-620.
4Gerad Salton, Chung-Shu Yang, Clement T Yu. A Theory of Term Importance in Automatic Text Analy- sis[J]. Journal of the American Society for Informa- tion Science, 1975, 26(1)~33-44.
5Gerard Salton. The Smart Retrieval System-Experi- ments in Automatic Document Processing[M]. New Jersey : Prentice-Hall, 1971.
6Stephen P Harter. A Probabilistic Approach to Auto- matic Keyword Indexing (part I ~ II)FJ]. Journal of the American Society for Information Science, 1975, 26 .. 197-206, 280-289.
7Stephen E Robertson, Cornelis J, Van Rijsbergen, et al. Probabilistic Models of Indexing and Searching [C]//Proceedings of the 3rd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval ( SIGRIR'80 ), Cambridge, UK, 1981: 35-56.
8Norbert Fuhr. Probabilistic Models in Information Re-trievall-J]. The Computer Journal, 1992, 35(3):243- 255.
9M E Maron, J L Kuhns. On Relevance, Probabilistic Indexing and Information RetrievalI-J]. Journal of the ACM, 1960, 7:216-244.
10Stephen E Robertson, Cornelis J, Van Rijsbergen, et al. Probabilistic Models of Indexing and Searching [C]//Proceedings of the 3rd Annual International ACM SIGIR Conference on Research and Develop- ment in Information Retrieval (SIGRIR'80), Cam- bridge, 1981: 35-56.

共引文献7

1於馨彦,孙瑞玲.医院特定患者信息资源快速检索仿真研究[J].计算机仿真,2017,34(12):389-392. 被引量：3
2张祥合.分布式文献数据库需求信息自适应检索仿真[J].计算机仿真,2018,35(9):409-412. 被引量：2
3董光芹,夏文秀.基于Top-k查询算法的图书自整合信息快速检索方法[J].吉林大学学报（理学版）,2020,58(3):666-670. 被引量：6
4于爽,李淑梅.图书电子资源信息分布式多模块检索仿真[J].计算机仿真,2020,37(6):439-442. 被引量：10
5田媛,郝文宁,靳大尉,陈刚,邹傲.基于多示例学习的长文档检索[J].无线电工程,2021,51(9):886-892. 被引量：2
6张帆,单艳.计算机多媒体中信息检索查询与反馈技术研究[J].数字通信世界,2021(11):98-100. 被引量：1
7闫悦,郭晓然,王铁君,饶强,王铠杰.问答系统研究综述[J].计算机系统应用,2023,32(8):1-18. 被引量：8

同被引文献16

1王宏志,燕钰.深度学习驱动的跨模态数据检索[J].哈尔滨理工大学学报,2021,26(1):9-16. 被引量：11
2俞学豪,赵子岩,马应龙,郑蓉蓉,郗子月,马超.基于BR和GBDT的电力信息通信客服系统多标签文本分类[J].电力系统自动化,2021,45(11):144-151. 被引量：22
3王春雨,蒋祖华,王福华,吉永军,江辉.面向工业软件开发的半结构化知识语义检索方法[J].计算机集成制造系统,2021,27(8):2371-2381. 被引量：7
4倪子健,李文强,唐忠.基于网络表示学习的本体语义挖掘与功能语义检索方法[J].工程设计学报,2021,28(5):539-547. 被引量：3
5李光宇.基于深度神经网络的多模态信息检索[J].计算机应用与软件,2022,39(1):219-224. 被引量：4
6姜姗,曹莉.隐私数据库多关键词秘密同态检索方法研究[J].计算机仿真,2022,39(4):408-412. 被引量：6
7李长宇,唐文秀.基于数据驱动的多微电网互联系统分布鲁棒运行优化[J].智慧电力,2022,50(5):1-8. 被引量：17
8刘丽华.档案管理中文本数据的增量多模态聚类方法[J].重庆大学学报,2022,45(5):147-156. 被引量：3
9杨力鹏,任工昌,刘朋,胡小龙.自主移动机器人语义信息应用研究进展[J].机械设计与制造,2022(6):270-273. 被引量：1
10杨宇环,张开生.基于特征聚类的文本信息检索算法研究[J].陕西科技大学学报,2022,40(4):178-182. 被引量：3

引证文献1

1王丽,蒋明,王伟,涂冰花,周明.电力信息通信客服机器人特定语义数据检索优化[J].电子设计工程,2024,32(20):168-171.

1郭亮,杨兴耀,于炯,韩晨,黄仲浩.基于注意力机制和门控网络相结合的混合推荐系统[J].计算机科学,2022,49(6):158-164. 被引量：1
2高钰澜,黄贤英,陶佳.基于轻量图卷积和注意力增强的多行为推荐模型[J].计算机应用研究,2022,39(6):1753-1759.
3黄菲菲.BERT的图模型文本摘要生成方法研究[J].现代信息科技,2022,6(2):91-95. 被引量：1
4陈颖,于炯,陈嘉颖,杜旭升.基于交叉层级数据共享的多任务模型[J].计算机应用,2022,42(5):1447-1454. 被引量：1
5李志欣,侯传文,谢秀敏.利用多重相似度矩阵增强跨模态哈希检索[J].计算机辅助设计与图形学学报,2022,34(6):933-945. 被引量：5
6王锦荟,金露,李泽超,唐金辉.基于知识蒸馏的跨模态哈希[J].中国科学：技术科学,2022,52(5):713-726. 被引量：4
7王琴,王鑫,颜靖柯,钟美玲,曾静.融合空间位置注意力机制的英语题注生成模型[J].计算机工程与应用,2022,58(12):139-148. 被引量：2
8本刊编辑部.关于中英文摘要书写格式的要求[J].中国美容医学,2022,31(5):18-18.
9王哲,刘殿兴,岳丰,舒光斌.基于NLP技术的反洗钱同一客户识别研究[J].中国金融电脑,2022(6):71-76.
10Mohamed Abd El-Hamid Farag Ahmed Askar,Amal Elsayed Aboutabl,Amr Galal.Utilizing Social Media Data Analytics to Enhance Banking Services[J].Intelligent Information Management,2022,14(1):1-14.

计算机技术与发展

2022年第6期

浏览历史

内容加载中请稍等...

用于信息检索的句子级深度关联匹配模型被引量：1

参考文献2

二级参考文献21

共引文献7

同被引文献16

引证文献1

相关作者

相关机构

相关主题

浏览历史

用于信息检索的句子级深度关联匹配模型 被引量：1

参考文献2

二级参考文献21

共引文献7

同被引文献16

引证文献1

相关作者

相关机构

相关主题

浏览历史

用于信息检索的句子级深度关联匹配模型被引量：1