融合义原相似度矩阵与字词向量双通道的短文本语义匹配策略

Short Text Semantic Matching Strategy Fusing Sememe Similarity Matrix and Dual-channel of Char-Word Vectors

下载PDF

导出

摘要短文本语义匹配任务的目的是判断两个短文本句子的语义是否一致。然而,现有的许多方法往往存在短文本语义信息不足、无法有效识别同义词等问题。针对这些不足,提出一种融合义原相似度矩阵与字词向量双通道的短文本语义匹配策略。首先,利用预训练模型Bert对输入的句子对进行编码;然后,对于句子中词级别的语义信息,利用FastText模型训练并获取文本的词向量,并加入BiLSTM模型进一步提取上下文语义信息。为了有效利用义原信息,在上述的双通道中分别加入多头注意力和用于对分离向量进行交互计算的协同注意力,并在注意力中分别融入对应的义原相似度矩阵,最后综合上述两部分向量推断出语义的一致性。在金融领域数据集BQ和开放域数据集LCQMC上的实验证明了所提算法的有效性。 The purpose of the short text semantic matching task is to judge whether the semantics of two short text sentences are consistent.However,many existing methods often have shortcomings such as insufficient semantic information of short text and inability to effectively identify synonyms.In response to these shortcomings,this paper proposes a short text semantic matching strategy that fuses sememe similarity matrix and dual-channel of char-word vectors.Firstly,the pre-trained model Bert is used to encode the input sentence pairs;for the word-level semantic information in the sentence,the FastText model is used to train and obtain the word vector of the text,and the BiLSTM model is added to further extract the contextual semantic information.Se-condly,making effective use of the semantic information,multi-head attention and co-attention for interactive calculation of separation vectors are added to the above-mentioned dual-channel.And the semantic similarity matrix is integrated into the attentions respectively.Finally,infer the semantic consistency according to the above vectors.The effectiveness of the above algorithm is proved by experiments on the financial dataset BQ and the open domain dataset LCQMC.

作者刘东旭段利国崔娟娟常轩伟 LIU Dongxu;DUAN Liguo;CUI Juanjuan;CHANG Xuanwei(College of Computer Science and Technology,Taiyuan University of Technology,Jinzhong,Shanxi 030600,China;Shanxi University of Electronic Science and Technology,Linfen,Shanxi 041000,China)

机构地区太原理工大学计算机科学与技术学院山西电子科技学院

出处《计算机科学》 CSCD 北大核心 2024年第12期250-258,共9页 Computer Science

基金山西省自然科学基金(202203021221234,202303021211052)。

关键词自然语言处理短文本义原协同注意力字词向量 Natural language processing Short text Sememe Co-attention Char-Word vector

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1张昊妍,段利国,王钦晨,郜浩.基于多任务联合训练的长文本多实体情感分析[J].计算机科学,2024,51(6):309-316. 被引量：2
2吕晓锋,赵书良,高恒达,武永亮,张宝奇.基于异质信息网的短文本特征扩充方法[J].计算机科学,2022,49(9):92-100. 被引量：1
3李奕霖,周艳平.基于孪生网络和字词向量结合的文本相似度匹配[J].计算机系统应用,2022,31(10):295-302. 被引量：4

二级参考文献6

1王灿辉,张敏,马少平.自然语言处理在信息检索中的应用综述[J].中文信息学报,2007,21(2):35-45. 被引量：50
2董自涛,包佃清,马小虎.智能问答系统中问句相似度计算方法[J].武汉理工大学学报（信息与管理工程版）,2010,32(1):31-34. 被引量：16
3程传鹏,齐晖.文本相似度计算在主观题评分中的应用[J].计算机工程,2012,38(5):288-290. 被引量：6
4贾晓婷,王名扬,曹宇.结合Doc2Vec与改进聚类算法的中文单文档自动摘要方法研究[J].数据分析与知识发现,2018,2(2):86-95. 被引量：20
5王海燕,陶皖,余玲艳,王鸣鹃.文本细粒度情感分析综述[J].河南科技学院学报（自然科学版）,2021,49(4):67-76. 被引量：6
6张瑾,段利国,李爱萍,郝晓燕.基于注意力与门控机制相结合的细粒度情感分析[J].计算机科学,2021,48(8):226-233. 被引量：11

共引文献4

1Zhenhui Li,Shuangping Xing,Lin Yu,Huiping Li,Fan Zhou,Guangqiang Yin,Xikai Tang,Zhiguo Wang.Binary Program Vulnerability Mining Based on Neural Network[J].Computers, Materials & Continua,2024,78(2):1861-1879.
2尹春勇,沈子宁.基于交互式特征与多尺度特征的文本相似度研究[J].计算机技术与发展,2024,34(8):86-92.
3王帅,何文春,王甫棣,赵希鹏,周远洋.大语言模型融合知识图谱与向量检索的问答系统[J].科学技术与工程,2024,24(32):13902-13910.
4邓翠艳,齐小刚.基于Transformer及多任务学习的电信网络诈骗识别[J].应用科技,2024,51(5):256-262.

1许诚,程强,白金辉,卢坤.基于预训练模型的问答系统设计[J].舰船电子工程,2024,44(8):135-139.
2戴薇,刘继.基于BERT和BiLSTM的方面级情感分类模型[J].信息技术与信息化,2024(11):177-181.
3章丰田.基于深度学习的智慧航空物流综合服务智能问答方法[J].自动化应用,2024,65(22):120-122.
4林飞.小学智能交互计算题库的开发与实践应用研究[J].安徽教育科研,2024(31):87-89.
5刘骏.商事留置权的“祛魅”:以牵连关系为中心[J].华东政法大学学报,2024,27(6):177-192.
6谢瑶瑶,邓三鸿,王昊,章学周.基于SAO语义挖掘的用户需求-专利技术匹配[J].数据分析与知识发现,2024,8(8):213-225.
7田志昌,江彤.手机云计算的脚手架软件建模和交互[J].内蒙古科技大学学报,2024,43(3):276-281.
8顾昀吟.用好“词句段运用”提升习作复习效率——以统编语文三年级下册为例[J].课程教材教学研究（上半月）,2024(10):17-20.
9彭继慎,马龙泽,孙梦宇,刘金龙.多尺度特征融合增强检测模型MFFE-YOLO[J].辽宁工程技术大学学报（自然科学版）,2024,43(5):625-632.
10孟航,薛向阳,黄山,吴尊飞,李媛,和建成.变电站一键顺控不停电验收技术[J].电力安全技术,2024,26(11):74-78.

计算机科学

2024年第12期

浏览历史

内容加载中请稍等...

融合义原相似度矩阵与字词向量双通道的短文本语义匹配策略

参考文献3

二级参考文献6

共引文献4

相关作者

相关机构

相关主题

浏览历史