融合高低层语义信息的自然语言句子匹配方法被引量：2

Natural language sentence matching method fusion of high-level and low-level semantic information

下载PDF

导出

摘要针对目前自然语言句子匹配方法未能融合公共语义信息以及难以捕获深层次语义信息的问题,提出了一种融合高低层语义信息的自然语言句子匹配算法。该算法首先采用预训练词向量GloVe和字符级别的词向量获取句子P和句子Q的词嵌入表示;其次,使用双向LSTM(long-short term memory)对P和Q进行编码,再初步融合P和Q获取低层语义信息;然后,计算P与Q的双向注意力,拼接得到语义表征,再计算其自注意力获取高层语义信息;最后,采用启发式的融合函数将低层语义信息和高层语义信息进行融合,得到最终的语义表征,使用卷积神经网络预测得到答案。在文本蕴涵识别和释义识别两个任务上评估了该模型。在文本蕴涵识别任务SNLI数据集和释义识别任务Quora数据集上进行了实验,实验结果表明该算法在SNLI测试集上的准确率为87.1%,在Quora测试集上的准确率为86.8%,验证了算法在自然语言句子匹配任务上的有效性。 This paper proposed a natural language sentence matching method that combined high-level and low-level semantic information to solve the problems about current natural language sentence matching method fail to integrate common semantic information and it is difficult to capture deep-semantic information.First of all,the method used pre-trained word vector GloVe and character-level word vector to obtained the word embedding representation of sentence P and sentence Q.Secondly,this paper encodered P and Q with bidirectional LSTM,then it contained low-level semantic information through preliminary fusion of P and Q.Thirdly,this paper calculated bidirectional attention between P and Q,then spliced them together to get semantic representation,afterwards it calculated its self-attention to obtained high-level semantic information.Finally,this paper used a heuristic fusion function to fuse the low-level semantic information with the high-level semantic information to obtain the final semantic representation,and it used a convolutional neural network to prediction answers.This paper evaluated the proposed model on two tasks,such as recognition textual entailment,paraphrase recognition.This paper conducted experiments on the SNLI dataset and the Quora dataset.The results show that the accuracy of the proposed algorithm on the SNLI test set is 87.1%,and the accuracy of the Quora test set is 86.8%,which verifies the effectiveness of the algorithm in the task of natural language sentence matching.

作者姜克鑫赵亚慧崔荣一 Jiang Kexin;Zhao Yahui;Cui Rongyi(Intelligent Information Processing Laboratory,Yanbian University,Yanji Jilin 133002,China)

机构地区延边大学智能信息处理研究室

出处《计算机应用研究》 CSCD 北大核心 2022年第4期1060-1063,1098,共5页 Application Research of Computers

基金国家语委“十三五”科研项目(YB135-76) 延边大学外国语言文学一流学科建设资助项目(18YLPY13)。

关键词自然语言句子匹配双向注意力机制自注意力机制卷积神经网络 natural language sentence matching bilateral attention mechanism self attention mechanism convolutional neural network

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1任函,盛雅琦,冯文贺,刘茂福.基于知识话题模型的文本蕴涵识别[J].中文信息学报,2015,29(6):119-126. 被引量：4
2胡超文,邬昌兴,杨亚连.基于扩展的S-LSTM的文本蕴含识别[J].计算机研究与发展,2020,57(7):1481-1489. 被引量：4
3黄江平,姬东鸿.基于卷积网络的句子语义相似性模型[J].华南理工大学学报（自然科学版）,2017,45(3):68-75. 被引量：5
4杨德志,柯显信,余其超,杨帮华.基于RCNN的问题相似度计算方法[J].计算机工程与科学,2021,43(6):1076-1080. 被引量：9
5赵琪,杜彦辉,芦天亮,沈少禹.基于Capsule-BiGRU的文本相似度分析算法[J].计算机工程与应用,2021,57(15):171-177. 被引量：9

二级参考文献34

1石晶,戴国忠.基于知网的文本推理[J].中文信息学报,2006,20(1):76-84. 被引量：8
2Dagan I, Glickman O, Magnini B. The PASCAL recognising textual entailment challenge[C]//Proceed2 ings of the Machine Learning Challenges, Evaluating Predictive Uncertainty, Visual Object Classification, and Recognising Tectual Entailment. Springer Berlin Heidelberg, 2006:177-190.
3Androutsopoulos I, Malakasiotis P. A Survey of Para- phrasing and Textul Entailment Methods[J]. Journal of Artificial Intelligence Research, 2010, 38(1): 135- 187.
4Dagan I, Dolan B. Recognizing textual entailment: Rational, evaluation and approaches[J]. Natural Lan-guage Engineering, 2009, 15(4): i-xvii.
5O Dzikovska M, D Nielsen R, Brew C, et al. SemE- val-2013 Task 7: The Joint Student Response Analysis and 8th Recognizing Textual Entailment Challenge [C]//Proeeedings of Second Joint Conferenee on Lexi- cal and Computational Semantics. 2013: 263-274.
6De Marneffe M C, Rafferty A N, Manning C D. Find- ing Contradictions in Text[C]//Proceedings of the ACL. 2008, 8: 1039-1047.
7Malakasiotis P, Androutsopoulos I. Learning textual entailment using SVMs and string similarity measures[C]//Proceedings of the ACL-PASCAL Workshop on Textual Entailment and Paraphrasing. Association for Computational Linguistics, 2007: 42-47.
8Kouylekov M, Magnini B. Recognizing textual entail- ment with tree edit distance algorithms[C]//Proceed- ings of the First Challenge Workshop Recognising Textual Entailment. 2005:17-20.
9Kouylekov M, Negri M. An open-source package for recognizing textual entailment [C]//Proceedings of the ACL 2010 System Demonstrations. Association for Computational Linguistics, 2010: 42-47.
10Lin D, Pantel P. Discovery of inference rules for question-answering[J]. Natural Language Engineer- ing, 2001, 7(4): 343-360.

共引文献24

1郭茂盛,张宇,刘挺.文本蕴含关系识别与知识获取研究进展及展望[J].计算机学报,2017,40(4):889-910. 被引量：28
2陈千,陈夏飞,郭鑫,王素格.面向阅读理解的多对一中文文本蕴含问题研究[J].中文信息学报,2018,32(4):87-94. 被引量：4
3张璐,芦天亮,杜彦辉.基于WMF_LDA主题模型的文本相似度计算[J].计算机应用研究,2019,36(10):2916-2919. 被引量：10
4胡超文,邬昌兴,杨亚连.基于扩展的S-LSTM的文本蕴含识别[J].计算机研究与发展,2020,57(7):1481-1489. 被引量：4
5袁蕾,高曙,郭淼,袁自勇.层次化神经网络模型下的释义识别方法[J].哈尔滨工业大学学报,2020,52(10):175-182. 被引量：4
6王兵,郑亚梅,陈茂柯,高凌云.基于Tri-BiLSTM-CNN 的钻井安全问答系统[J].西南石油大学学报（自然科学版）,2020,42(6):157-164. 被引量：5
7孙毅刚,刘凯捷.基于PSO-LSTM网络的航电系统故障率预测研究[J].航空科学技术,2021,32(5):17-22. 被引量：5
8Peiying Zhang,Xingzhe Huang,Lei Zhang.Information mining and similarity computation for semi-/un-structured sentences from the social data[J].Digital Communications and Networks,2021,7(4):518-525. 被引量：1
9代翔,孙海春,朱容辰,孙天杨.联合注意力机制与MatchPyramid的文本相似度分析算法[J].计算机工程与应用,2022,58(19):158-165. 被引量：1
10李伊仝,王红斌,程良.融入新闻标题信息的新闻文本与评论的语义相似度计算方法[J].吉林大学学报（理学版）,2022,60(6):1399-1406. 被引量：1

同被引文献10

1郭茂盛,张宇,刘挺.文本蕴含关系识别与知识获取研究进展及展望[J].计算机学报,2017,40(4):889-910. 被引量：28
2王海涛,宋文,王辉.一种基于LSTM和CNN混合模型的文本分类方法[J].小型微型计算机系统,2020,41(6):1163-1168. 被引量：40
3郑德权,于凤,王贺伟.融合语言知识与深度学习的文本蕴含识别[J].计算机工程与应用,2020,56(24):157-163. 被引量：1
4杨德志,柯显信,余其超,杨帮华.基于RCNN的问题相似度计算方法[J].计算机工程与科学,2021,43(6):1076-1080. 被引量：9
5赵琪,杜彦辉,芦天亮,沈少禹.基于Capsule-BiGRU的文本相似度分析算法[J].计算机工程与应用,2021,57(15):171-177. 被引量：9
6杨璐,何明祥.基于门控机制和卷积神经网络的中文文本情感分析模型[J].计算机应用,2021,41(10):2842-2848. 被引量：5
7陈可嘉,刘惠.基于改进BiGRU-CNN的中文文本分类方法[J].计算机工程,2022,48(5):59-66. 被引量：13
8孙刘成,黄润才.融合LSTM和注意力机制的新闻文本分类模型[J].传感器与微系统,2022,41(9):38-41. 被引量：4
9方红,苏铭,冯一铂,张澜.结合gazetteers和句法依存树的中文命名实体识别[J].计算机工程与应用,2022,58(18):227-232. 被引量：1
10卢嘉荣,肖红,姜文超,杨建仁,王涛.基于语料关联生成的知识增强型BERT[J].湖北大学学报（自然科学版）,2022,44(6):732-741. 被引量：1

引证文献2

1杨春霞,陈启岗,徐奔,马文文.基于依存句法和图注意力网络的句子匹配[J].计算机工程与应用,2023,59(9):123-129.
2张博伦,赵亚慧,姜克鑫,卢星华.基于知识增强的文本分类方法[J].延边大学学报（自然科学版）,2024,50(2):78-86.

1刘高军,寇婕,段建勇,霍卫涛,王昊.丰富特征提取的句子语义等价识别研究[J].小型微型计算机系统,2021,42(10):2017-2022.
2乔璇,郭晓静,杨金锋.基于注意力机制的陆空通话语义感知方法[J].计算机应用与软件,2022,39(1):212-218. 被引量：3
3国家电网,永远的神[J].微型计算机,2021,41(32):44-55.
4杜倩龙,宗成庆,苏克毅.融合词义信息的文本蕴涵识别方法[J].中文信息学报,2021,35(7):30-40. 被引量：1
5张继松.世界问中国中国我来说——央视网国际传播的创新实践[J].国际传播,2021(6):110-116.
6陈岳林,田文靖,蔡晓东,郑淑婷.基于密集连接网络和多维特征融合的文本匹配模型[J].浙江大学学报（工学版）,2021,55(12):2352-2358. 被引量：2
7方伟,王玉,闫文君,林冲.基于神经网络的符号化飞行动作识别[J].系统工程与电子技术,2022,44(3):737-745. 被引量：1
8孙世岩,张钢,梁伟阁,佘博,田福庆.基于时间序列数据扩增和BLSTM的滚动轴承剩余寿命预测方法[J].系统工程与电子技术,2022,44(3):1060-1068. 被引量：10
9孙彦玺,陈继斌,武东辉.基于卷积神经网络-双向长短期记忆网络的人体活动识别方法[J].科学技术与工程,2022,22(4):1517-1525. 被引量：10
10唐詹,柏召,刁磊,郭旭超,周晗,李林.基于注意力池化和堆叠式结构的病虫害文献识别模型[J].农业机械学报,2021,52(S01):178-184. 被引量：2

计算机应用研究

2022年第4期

浏览历史

内容加载中请稍等...

融合高低层语义信息的自然语言句子匹配方法被引量：2

参考文献5

二级参考文献34

共引文献24

同被引文献10

引证文献2

相关作者

相关机构

相关主题

浏览历史

融合高低层语义信息的自然语言句子匹配方法 被引量：2

参考文献5

二级参考文献34

共引文献24

同被引文献10

引证文献2

相关作者

相关机构

相关主题

浏览历史

融合高低层语义信息的自然语言句子匹配方法被引量：2