融合语义角色和自注意力机制的中文文本蕴含识别被引量：9

A Chinese Textual Entailment Recognition Method Incorporating Semantic Role and Self-Attention

下载PDF

导出

摘要文本蕴含识别旨在识别两个给定句子之间的逻辑关系.本文通过构造语义角色和自注意力机制融合模块,把句子的深层语义信息与Transformer模型的编码部分相结合,从而增强自注意力机制捕获句子语义的能力.针对中文文本蕴含识别在数据集上存在规模小和噪声大的问题,使用大规模预训练语言模型能够提升模型在小规模数据集上的识别性能.实验结果表明,提出的方法在第十七届中国计算语言学大会中文文本蕴含识别评测数据集CNLI上的准确率达到了80.28%. Recognizing textual entailment is intended to infer the logical relationship between two given sentences.In this paper,we incorporate the deep semantic information of sentences and the encoder of Transformer by constructing the SRL-Attention fusion module,and it effectively improves the ability of self-attention mechanism to capture sentence semantics.Furthermore,concerning the small scale and high noise problems on the dataset,we use large-scale pre-trained language model improving the recognition performance of model on small-scale dataset.Experimental results show that the accuracy of our model on the dataset CNLI,it is released as Chinese textual entailment recognition evaluation corpus at the 17th China National Conference on Computational Linguistics,reaches 80.28%.

作者张志昌曾扬扬庞雅丽 ZHANG Zhi-chang;ZENG Yang-yang;PANG Ya-li(College of Computer Science and Engineering,Northwest Normal University,Lanzhou,Gansu 730000,China)

机构地区西北师范大学计算机科学与工程学院

出处《电子学报》 EI CAS CSCD 北大核心 2020年第11期2162-2169,共8页 Acta Electronica Sinica

基金国家自然科学基金(No.61762081,No.61662067,No.61662068) 甘肃省重点研发计划(No.17YF1GA016)。

关键词自然语言处理文本蕴含自注意力机制语义角色标注预训练语言模型 natural language processing textual entailment self-attention mechanism semantic role labeling pre-trained language model

分类号 TP391.1 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1刘茂福,李妍,姬东鸿.基于事件语义特征的中文文本蕴含识别[J].中文信息学报,2013,27(5):129-136. 被引量：11
2袁里驰.基于配价结构和语义依存关系的句法分析统计模型[J].电子学报,2013,41(10):2029-2034. 被引量：6
3谭咏梅,刘姝雯,吕学强.基于CNN与双向LSTM的中文文本蕴含识别方法[J].中文信息学报,2018,32(7):11-19. 被引量：23
4郭茂盛,张宇,刘挺.文本蕴含关系识别与知识获取研究进展及展望[J].计算机学报,2017,40(4):889-910. 被引量：27
5袁里驰.利用配价信息的语义角色标注[J].电子学报,2017,45(10):2533-2539. 被引量：4
6刘广灿,曹宇,许家铭,徐波.基于对抗正则化的自然语言推理[J].自动化学报,2019,45(8):1455-1463. 被引量：4
7翟延冬,王康平,张东娜,黄岚,周春光.一种基于WordNet的短文本语义相似性算法[J].电子学报,2012,40(3):617-620. 被引量：34
8杨震,范科峰,雷建军,郭军.基于语义的文本流形研究[J].电子学报,2009,37(3):557-561. 被引量：10

二级参考文献79

1沈家煊.句式和配价[J].中国语文,2000(4):291-297. 被引量：220
2董振东,董强,郝长伶.知网的理论发现[J].中文信息学报,2007,21(4):3-9. 被引量：97
3Bregler C, Omohundro S. Nonlinear manifold learning for visual speech recognition [ A ]. Proc of Fifth Int. Conf. on Computer Vision[ C ]. Washington, DC, USA: IEEE Computer Society, 1995.494.
4Roweis S, Saul L. Nonlinear dimensionality reduction by locally linear embedding [ J]. Science, 2000,290(5500) : 2323 - 2326.
5Seung H S,Lee D D. The manifold ways of perception[ J]. Science, 2000,290(5500) : 2268 - 2269.
6Tenenbaum J, Silva D D, Langford J. A global geometric framework for nonlinear dimensionality reduction[J]. Science, 2000,290(5500) : 2319 - 2323.
7Donoho D, Grimes C. Hessian eigenmaps: Locally linear embedding techniques for highdimensional data[ J ]. PNAS, 2003, 100(10) : 5591 - 5596.
8Belkin M, Niyogi P. Laplacian eigenmaps for dimensionality reduction and data representation[ J ]. Neural Computation, 2003, 15(6) : 1373 - 1396.
9Coifman R, Lafon S, Lee A, et al. Geometric diffusions as a tool for harmonic analysis and structure definition of data: Diffusionmaps[ J]. PNAS, 2005,102(21 ) : 7426 - 7431.
10Kouropteva O, Okun O, Pietikaien M. Classification of handwritten digits using supervised locally linear embedding algorithm and support vector machine[ A]. Proc of the llth European Symposium on Artificial Neural Networks [ C]. Bruges, Belgium: D-side publi, 2003.229 - 234.

共引文献103

1丁美荣,冯伟森,黄荣翔,罗嘉俊.基于预训练模型和基础词典扩展的酒店评论情感分析[J].计算机系统应用,2022,31(11):296-308. 被引量：3
2马天欢.语用视角下复述句生成方式的类型考察[J].中文信息学报,2021,35(10):32-38.
3杨震,段立娟,赖英旭.基于字符串相似性聚类的网络短文本舆情热点发现技术[J].北京工业大学学报,2010,36(5):669-673. 被引量：25
4丁军平,蔡皖东.面向元信息分类的支持向量机改进技术[J].西安交通大学学报,2011,45(8):37-42. 被引量：1
5翟延冬,王康平,张东娜,黄岚,周春光.一种基于WordNet的短文本语义相似性算法[J].电子学报,2012,40(3):617-620. 被引量：34
6雷霖,熊伟,景宁,肖建夫.一种基于流形距离的中文语块聚类分析方法[J].北京大学学报（自然科学版）,2013,49(1):126-132. 被引量：2
7吴丹,苏一丹.基于多阈连续条件随机场的标签推荐[J].计算机应用研究,2013,30(5):1312-1315. 被引量：2
8张志飞,苗夺谦,高灿.基于LDA主题模型的短文本分类方法[J].计算机应用,2013,33(6):1587-1590. 被引量：76
9YANG Zhen,WANG Laitao,FAN Kefeng,LAI Yingxu.Exemplar-Based Clustering Analysis Optimized by Genetic Algorithm[J].Chinese Journal of Electronics,2013,22(4):735-740. 被引量：1
10杨博,蔡东风,赵奇猛,杨华.融合WordNet的无监督语义分析研究[J].小型微型计算机系统,2014,35(2):368-373. 被引量：2

同被引文献42

1唐焕玲,林正奎,鲁明羽.基于差异性评估对Co-training文本分类算法的改进[J].电子学报,2008,36(B12):138-143. 被引量：4
2王李冬,魏宝刚,袁杰.基于概率主题模型的文档聚类[J].电子学报,2012,40(11):2346-2350. 被引量：24
3袁里驰.基于配价结构和语义依存关系的句法分析统计模型[J].电子学报,2013,41(10):2029-2034. 被引量：6
4尹存燕,黄书剑,戴新宇,陈家骏.中英命名实体识别及对齐中的中文分词优化[J].电子学报,2015,43(8):1481-1487. 被引量：6
5谭咏梅,王志浩.基于多特征的中文文本蕴含识别[J].北京邮电大学学报,2015,38(6):98-103. 被引量：2
6郭茂盛,张宇,刘挺.文本蕴含关系识别与知识获取研究进展及展望[J].计算机学报,2017,40(4):889-910. 被引量：27
7刘良选,黄梦醒.融合词向量特征的双词主题模型[J].计算机应用研究,2017,34(7):2055-2058. 被引量：7
8袁里驰.利用配价信息的语义角色标注[J].电子学报,2017,45(10):2533-2539. 被引量：4
9王明轩,刘群.基于深度神经网络的语义角色标注[J].中文信息学报,2018,32(2):50-57. 被引量：10
10柯永红,朱永福,穗志方,俞士汶.基于多特征的语义角色标注一致性计算方法研究[J].北京大学学报（自然科学版）,2018,54(3):475-480. 被引量：3

引证文献9

1周东明,张灿龙,李志欣,王智文.基于多层级视觉融合的图像描述模型[J].电子学报,2021,49(7):1286-1290. 被引量：3
2王伟,孙成胜,伍少梅,张芮,康睿,李小俊.一种轻量级文本蕴含模型[J].四川大学学报（自然科学版）,2021,58(5):31-38. 被引量：3
3张凌明,赵悦,李鹏程,刘洋,高陈强.基于局部注意力机制的三维牙齿模型分割网络[J].电子学报,2022,50(3):681-690. 被引量：3
4唐焕玲,卫红敏,王育林,朱辉,窦全胜.结合LDA与Word2vec的文本语义增强方法[J].计算机工程与应用,2022,58(13):135-145. 被引量：18
5袁里驰.利用深度神经网络并结合配价信息的语义角色标注[J].小型微型计算机系统,2022,43(9):1925-1930.
6张志昌,于沛霖,庞雅丽,朱林,曾扬扬.SMGN:用于对话状态跟踪的状态记忆图网络[J].电子学报,2022,50(8):1851-1858.
7杨利平,侯振威,辜小花,郝峻永.弱标签声音事件检测的空间-通道特征表征与自注意池化[J].电子学报,2023,51(2):297-306.
8钟茂生,孙磊,罗贤增,王明文.融入句法结构和摘要信息的文本蕴含识别模型[J].计算机技术与发展,2023,33(10):120-127.
9卫红敏.基于有监督双词主题模型的短文本分类方法[J].现代信息科技,2024,8(10):56-59.

二级引证文献27

1洪海蓝,李文林,杨涛,李玥,梅文静.基于知识图谱的海洋中药智能问答系统的设计与实现[J].世界科学技术-中医药现代化,2023(6):1935-1941. 被引量：3
2王宇航,张灿龙,李志欣,王智文.体现用户意图和风格的图像描述生成[J].广西师范大学学报（自然科学版）,2022,40(4):91-103.
3赵训新,王卫玉,马泽宁,陈启卷.基于知识图谱的水电机组主动维护体系探讨[J].水电与新能源,2022,36(8):23-27. 被引量：3
4贺伟雄,柏林元,郭文娟.一种面向PDF文档的文本复制优化方法研究[J].软件,2022,43(7):63-67. 被引量：1
5杨益兴,许洪波.基于语义相似度与PROMETHEE的生鲜电商服务质量评价[J].昆明理工大学学报（社会科学版）,2023,23(2):109-118. 被引量：1
6王彬,向甜,吕艺东,王晓帆.基于NSGA-Ⅱ的自适应多尺度特征通道分组优化算法[J].计算机应用,2023,43(5):1401-1408.
7邹丽强,何月顺.多特征融合的文本相似度方法[J].现代电子技术,2023,46(11):103-108.
8崔家礼,黄敏慧,刘东林,贾瑞明,李涵.计算机辅助设计三维牙颌分割及应用场景[J].中国组织工程研究,2024,28(2):252-257.
9周志刚,窦路遥.基于专利视角的企业潜在竞争与合作关系预测——以钙钛矿型太阳能电池为例[J].科技管理研究,2023,43(10):136-145. 被引量：2
10胡太义.基于双流网络和改进DGCNN的三维牙齿分割方法[J].工业控制计算机,2023,36(7):103-104.

1郑德权,于凤,王贺伟.融合语言知识与深度学习的文本蕴含识别[J].计算机工程与应用,2020,56(24):157-163. 被引量：1
2豆格才让.谈谈拓展语言研究视野的必要性——论学习NLP的必要性及研究方法[J].小说月刊（下半月）,2020(12):0289-0290.
3俞敬松,吴聪,曹喜信.政府公文领域细粒度命名实体识别的实用化研究与设计[J].微纳电子与智能制造,2020,2(3):23-29. 被引量：2
4吴行望.徐闻闽语表被动的“乞”字句及其配价研究[J].小说月刊（下半月）,2020(11):0207-0208.
5数据[J].电脑迷·教师研修,2020(2):4-5.
6王兵,郑亚梅,陈茂柯,高凌云.基于Tri-BiLSTM-CNN 的钻井安全问答系统[J].西南石油大学学报（自然科学版）,2020,42(6):157-164. 被引量：5
7朴珍玉.“Vi+了+O”的句法-语义特征及数量成分的制约作用[J].汉语学习,2020(6):36-45. 被引量：3
8王艳伟.语料库语言学及语言科技发展国际会议综述[J].外语教育,2019(1):174-178.
9向小华,陈颖悟,吴晓玲,李超,王志伟,康爱卿.城市二维内涝模型的GPU并行方法[J].河海大学学报（自然科学版）,2020,48(6):528-533. 被引量：18

电子学报

2020年第11期

浏览历史

内容加载中请稍等...

融合语义角色和自注意力机制的中文文本蕴含识别被引量：9

参考文献8

二级参考文献79

共引文献103

同被引文献42

引证文献9

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

融合语义角色和自注意力机制的中文文本蕴含识别 被引量：9

参考文献8

二级参考文献79

共引文献103

同被引文献42

引证文献9

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

融合语义角色和自注意力机制的中文文本蕴含识别被引量：9