基于SA-BiLSTM的中文问句相似度计算方法被引量：1

Chinese Question Similarity Computation Method Based on Self-Attention and Bi-LSTM

下载PDF

导出

摘要在智能客服问答系统中,用户所提的问句存在着特征稀疏性强、口语化严重以及错别字等特点,导致问句相似度计算的准确率不高,出现答非所问的情况。提出一种基于双向长短时记忆神经网络的问句相似度计算模型SA-BiLSTM。通过对问句进行字向量的表示方法,采用Bi-LSTM提取句子语序关系特征并结合Self-Attention机制动态的调整特征权重,提高模型对问题的理解能力。在微众银行智能客服问句匹配大赛数据集(CCKS2018 Task3)上的实验结果表明,对问句采用字向量表示比词向量表示效果更好,使用自注意力机制可以使模型能学习更多问句中关键特征,SA-BiLSTM模型对问句的识别能力更强,其F1值提高了1.42%。 In the intelligent customer service question answering system, the questions asked by users have the characteristics of strong feature sparseness, serious colloquialization, and typos, which results in the low accuracy of the calculation of the similarity of the question, and an answer beongd the questions. In the paper, we proposed a question similarity computation model based on Bidirectional Long-Short Term Memory SA-BiLSTM. Through the word vector representation method of the question sentence, the Bi-LSTM was used to extract the sentence word order relationship features and the self-attention mechanism was used to dynamically adjust the feature weights, so as to improve the understand ability of the model to the problem. The experimental results on CCKS2018 Task3 show that using character vector representation for question sentences is better than word vector representation. Using self-attention mechanism can enable the model to learn more key feature, the SA-BiLSTM model has stronger ability to recognize the question sentence, and its F1 measure increases by 1.42%.

作者黄晓洲段隆振周玲元 HUANG Xiao-zhou;DUAN Long-zhen;ZHOU Ling-yuan(College of Information Engineering,Nanchang University,Nanchang,330029,China;College of Economics and Management,Nanchang HangKongUniversity,Nanchang,330063,China)

机构地区南昌大学信息工程学院南昌航空大学经济管理学院

出处《计算机仿真》北大核心 2022年第10期486-491,共6页 Computer Simulation

基金国家自然科学基金资助项目(71761028)。

关键词句子相似度计算字向量自注意力机制双向长短时记忆网络 Sentence similarity computation Character vector Self-attention Bi-LSTM

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1廖志芳,周国恩,李俊锋,刘飞,蔡飞.中文短文本语法语义相似度算法[J].湖南大学学报（自然科学版）,2016,43(2):135-140. 被引量：13
2翟社平,李兆兆,段宏宇,李婧,董迪迪.多特征融合的句子语义相似度计算方法[J].计算机工程与设计,2019,40(10):2867-2873. 被引量：14
3闫红,李付学,周云.基于HowNet句子相似度的计算[J].计算机技术与发展,2015,25(11):53-57. 被引量：10
4黄江平,姬东鸿.基于句子语义距离的释义识别研究[J].四川大学学报（工程科学版）,2016,48(6):202-207. 被引量：4
5李晓,解辉,李立杰.基于Word2vec的句子语义相似度计算研究[J].计算机科学,2017,44(9):256-260. 被引量：56
6冯兴杰,张乐,曾云泽.基于多注意力CNN的问题相似度计算模型[J].计算机工程,2019,45(9):284-290. 被引量：15
7胡艳霞,王成,李弼程,李海林,吴以茵.基于多头注意力机制Tree-LSTM的句子语义相似度计算[J].中文信息学报,2020,34(3):23-33. 被引量：18
8纪明宇,王晨龙,安翔,牟伟晔.面向智能客服的句子相似度计算方法[J].计算机工程与应用,2019,55(13):123-128. 被引量：15

二级参考文献49

1杨思春.一种改进的句子相似度计算模型[J].电子科技大学学报,2006,35(6):956-959. 被引量：34
2董振东,董强,郝长伶.知网的理论发现[J].中文信息学报,2007,21(4):3-9. 被引量：97
3刘群李素建.基于《知网》的词汇语义相似度计算[C]..第三界汉语词汇语义研讨会[C].台北,2002..
4刘群,李素建.基于《知网》的词汇语义相似度的计算[C].台北:第三届汉语词汇语义学研讨会,2002.
5Lin Dekang. An information-theoretic definition of similarity semantic distance in WordNet [ C ]//Proceedings of the fif- teenth international conference on machine learning. [ s. 1. ] : [s.n. ] ,1998.
6Jacob B, Benjamin C. Calculating the Jaccard similarity coeffi- cient with map reduce for entity pairs in Wikipedia[ EB/OL]. 2008. http://www, infosci, comell, edu/weblab/papers/ Bank2008. pdf.
7Allan J, Bolivar A, Wade C. Retrieval and novelty detection at the sentence level [ C ]//Proceedings of SIGIR. [ s. 1. ] : [ s. n. ] ,2003:314-321.
8Li Y, McLean D, Bandar Z A, et al. Sentence similarity based on semantic nets and corpus statistics [ J ]. IEEE Transactions on Knowledge and Data Engineering, 2006, 18 (8):1138- 1150.
9Chukfong I-I, Masrah A A M, Rabiah A K, et al. Word sense disambiguation based sentence similarity[ C ]//Proceedings of the 23rd international conference on computational linguistics. [ s. 1. ]: [ s. n. ] ,2010:418-426.
10刘小字.基于语义理解的中文常问问答系统的研究[D].大连:大连理工大学,2006.

共引文献124

1孟旭,谢靖,李春旺.基于核心主题特征的作者身份识别研究[J].知识管理论坛,2023(5):351-364.
2洪海蓝,李文林,杨涛,李玥,梅文静.基于知识图谱的海洋中药智能问答系统的设计与实现[J].世界科学技术-中医药现代化,2023(6):1935-1941. 被引量：4
3闫硕,付丽琴,邢亚英,侯佳丽,马玲.基于Seq2Seq的校园招生智能客服设计与实现[J].电声技术,2022,46(8):72-74. 被引量：2
4黄培红.面向知觉形式化特征的自然语言理解十年研究进展[J].智能安全,2022,1(2):90-100.
5黄鲁成,滕旭东,苗红,吴菲菲,王小丽.创新政策中创新激励与负责任创新平衡态评估研究[J].中国软科学,2018(5):25-38. 被引量：16
6李琳,李辉.一种基于概念向量空间的文本相似度计算方法[J].数据分析与知识发现,2018,2(5):48-58. 被引量：20
7宋冬云,郑瑾,张祖平.基于混合策略的中文短文本相似度计算[J].计算机工程与应用,2018,54(12):116-120. 被引量：8
8张小川,于旭庭,张宜浩.一种改进的基于知网的词语语义相似度算法[J].计算机应用研究,2018,35(8):2285-2288. 被引量：6
9田星,郑瑾,张祖平.基于词向量的Jaccard相似度算法[J].计算机科学,2018,45(7):186-189. 被引量：30
10倪高伟,李涛,刘峥.结合语义和结构的短文本相似度计算[J].计算机技术与发展,2018,28(8):104-108. 被引量：4

同被引文献14

1周达明,李黎.基于CNN-BiGRU模型的操作票自动化校验方法[J].广东电力,2020,33(9):58-65. 被引量：5
2胡东林,钟少军,刘东尧,廖永坚.基于深度学习的调度操作票审核系统[J].农村电气化,2020(12):51-52. 被引量：3
3冯子文,朱永利.基于有限状态机的变电站倒闸操作票生成方法[J].发电技术,2022,43(3):501-509. 被引量：7
4柴源.基于LSTM和Word2vec的图书评论文本情感分析研究[J].信息技术,2022,46(7):59-64. 被引量：3
5朱炳铨,吴华华,童存智,谷炜,马翔,吕磊炎.基于专家系统的电网调度操作票自动生成系统研究[J].电子器件,2022,45(4):925-930. 被引量：5
6郑俊翔,刘辉乐,黄达铁,孙景钌,陆燕.基于语义分析的电网调度操作票智能校核方法[J].浙江电力,2022,41(10):42-49. 被引量：4
7尹潇伟,孙仁诚,王霄鹏,邵峰晶,王光波.基于深度学习的中文票据文本检测与识别方法[J].青岛大学学报（自然科学版）,2022,35(4):1-7. 被引量：2
8陈铁,曹颖,蔡东阁,何思敏.基于深度强化学习的变电站倒闸操作序列生成方法[J].电工材料,2023(1):78-84. 被引量：3
9淦亚婷,安建业,徐雪.基于深度学习的短文本分类方法研究综述[J].计算机工程与应用,2023,59(4):43-53. 被引量：11
10周海波,李天.基于BERT-CNN中间任务转移模型的短文本讽刺文本分类研究[J].智能计算机与应用,2023,13(5):156-160. 被引量：2

引证文献1

1吴奇珂,程培军,钱韦廷,姜浩宇,胡佳.调度操作票自动校验的CNN-BiLSTM方法[J].核电子学与探测技术,2024,44(2):316-322.

1黎江涛,饶高琦.中文问句的形式分类和资源建设[J].中文信息学报,2022,36(7):69-76.
2郴星.孩子梦游怎么办?[J].健康生活,2022(10):27-27.
3尚福华,蒋毅文,曹茂俊.一种增强的多粒度特征融合语义匹配模型[J].计算机技术与发展,2022,32(7):28-33. 被引量：1
4胡庆芳.精准指导:基于错题成因分析给予差异指导[J].中学语文,2022(31):63-63.
5李帅驰,杨志豪,王鑫雷,韩钦宇,林鸿飞.基于特征增强的开放域知识库问答系统[J].计算机工程与应用,2022,58(17):206-212. 被引量：2
6张帅,黄勃,巨家骥.一种改进的融合文本主题特征的情感分析模型[J].数据与计算发展前沿,2022,4(6):118-128. 被引量：3
7张宇飞.家校云沟通,爱在“云端”[J].教育家,2022(43):35-35.
8张海丽,郎彩华.关于提高小学生数学学习效率的途径研究结题报告[J].传奇故事,2023(2):87-88.

计算机仿真

2022年第10期

浏览历史

内容加载中请稍等...

基于SA-BiLSTM的中文问句相似度计算方法被引量：1

参考文献8

二级参考文献49

共引文献124

同被引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于SA-BiLSTM的中文问句相似度计算方法 被引量：1

参考文献8

二级参考文献49

共引文献124

同被引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于SA-BiLSTM的中文问句相似度计算方法被引量：1