一种轻量级文本蕴含模型被引量：3

A lightweight text entailment model

下载PDF

导出

摘要现有主流文本蕴含模型大多采用循环神经网络编码,并采用各种注意力推理机制或辅以手工提取的特征来提升蕴含关系识别准确率,由于复杂的网络结构和RNNs网络串行机制导致这些模型训练和推理速度较慢.本文提出轻量级文本蕴含模型,采用自注意力编码器编码文本向量,点积注意力交互两段文本,再采用卷积神经网络对交互特征推理,整个结构可根据不同数据的推理难度叠加不同模块数量.在多个文本蕴含数据集实验表明,本文模型在保持较高识别准确率情况下仅用一个块参数仅为665 K,模型推理速度相比其他主流文本蕴含模型至少提升一倍. Most of the existing mainstream textual entailment models adopt recurrent neutral network to encode text,and various complex attention mechanisms or manually extracted text features are used to improve the accuracy of textual entailment recognition.The training and inference speed of the models is usually slow due to the complex network structure and the sequential nature of RNNs.In this paper,Lightweight Text Entailment Model is proposed.In the proposed model,the self-attentional encoder is adopted to encode text vectors;the dot product attention mechanism is adopted to interact two texts;the convolutional neural network is adopted to deduce interactive features,and the module number of the structure can be adjusted according to the reasoning difficulty of data.Experiments on multiple datasets show that the parameter size of single module in the model is only 665 K,and the inference speed of the model is at least twice as high as that of other mainstream models,under the condition of high accuracy.

作者王伟孙成胜伍少梅张芮康睿李小俊 WANG Wei;SUN Cheng-Sheng;WU Shao-Mei;ZHANG Rui;KANG Rui;LI Xiao-Jun(China Electronic Technology Cyber Security Company Limited,Chengdu 610041,China;College of Computer Science,Sichuan University,Chengdu 610065,China;Westone Information Industry INC,Chengdu 610041,China)

机构地区中国电子科技网络信息安全有限公司四川大学计算机学院卫士通信息产业股份有限公司

出处《四川大学学报（自然科学版）》 CAS CSCD 北大核心 2021年第5期31-38,共8页 Journal of Sichuan University(Natural Science Edition)

基金四川省新一代人工智能重大专项(2018GZDZX0039) 四川省重点研发项目(2019YFG0521,JG2020125)。

关键词注意力机制卷积神经网络轻量级文本蕴含 Attention mechanism CNN Lightweight Textual entailment

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1张志昌,曾扬扬,庞雅丽.融合语义角色和自注意力机制的中文文本蕴含识别[J].电子学报,2020,48(11):2162-2169. 被引量：9
2高云龙,吴川,朱明.基于改进卷积神经网络的短文本分类模型[J].吉林大学学报（理学版）,2020,58(4):923-930. 被引量：19
3杨军,王亦民.基于深度卷积神经网络的三维模型识别[J].重庆邮电大学学报（自然科学版）,2019,31(2):253-260. 被引量：22

二级参考文献8

1杨震,范科峰,雷建军,郭军.基于语义的文本流形研究[J].电子学报,2009,37(3):557-561. 被引量：10
2翟延冬,王康平,张东娜,黄岚,周春光.一种基于WordNet的短文本语义相似性算法[J].电子学报,2012,40(3):617-620. 被引量：34
3刘茂福,李妍,姬东鸿.基于事件语义特征的中文文本蕴含识别[J].中文信息学报,2013,27(5):129-136. 被引量：11
4袁里驰.基于配价结构和语义依存关系的句法分析统计模型[J].电子学报,2013,41(10):2029-2034. 被引量：6
5郭茂盛,张宇,刘挺.文本蕴含关系识别与知识获取研究进展及展望[J].计算机学报,2017,40(4):889-910. 被引量：28
6袁里驰.利用配价信息的语义角色标注[J].电子学报,2017,45(10):2533-2539. 被引量：4
7谭咏梅,刘姝雯,吕学强.基于CNN与双向LSTM的中文文本蕴含识别方法[J].中文信息学报,2018,32(7):11-19. 被引量：23
8刘广灿,曹宇,许家铭,徐波.基于对抗正则化的自然语言推理[J].自动化学报,2019,45(8):1455-1463. 被引量：4

共引文献47

1冯建英,吴丹丹,王博,王智,穆维松.中文在线评论文本分析对生鲜农产品电商影响研究综述[J].农业机械学报,2021,52(S01):504-512. 被引量：7
2袁丽莉,侯磊,张正平.LDA最大概率填充与BiLSTM模型的文本分类研究[J].智能计算机与应用,2021,11(12):32-36. 被引量：1
3杨军,党吉圣.采用深度级联卷积神经网络的三维点云识别与分割[J].光学精密工程,2020,28(5):1187-1199. 被引量：18
4于挺,杨军.基于K近邻卷积神经网络的点云模型识别与分类[J].激光与光电子学进展,2020,57(10):347-355. 被引量：10
5党吉圣,杨军.多特征融合的三维模型识别与分割[J].西安电子科技大学学报,2020,47(4):149-157. 被引量：12
6任永梅,杨杰,郭志强,陈奕蕾.基于三维卷积神经网络的点云图像船舶分类方法[J].激光与光电子学进展,2020,57(16):222-230. 被引量：7
7马跃,李成蒙,尹震宇,李明时,柴安颖,赵志浩.一种Dual-LSTM混合模型的产线设备状态预测方法与应用[J].小型微型计算机系统,2020,41(12):2470-2474. 被引量：1
8党吉圣,杨军.深度图注意力CNN的三维模型识别[J].计算机科学与探索,2021,15(1):141-149. 被引量：6
9叶书函,詹瑞,陈训敏.基于插值一致性的半监督三维目标分类算法[J].计算机应用,2020,40(S02):42-47.
10汤磊,丁博,何勇军.基于卷积神经网络的高效三维模型检索方法[J].电子学报,2021,49(1):64-71. 被引量：10

同被引文献24

1宋艳娟,张文德.基于XML的PDF文档信息抽取系统的研究[J].现代图书情报技术,2005(9):10-13. 被引量：16
2张晓培,李祥.从Unicode到GBK的内码转换[J].微计算机应用,2006,27(6):757-759. 被引量：20
3陈云榕,刘立柱,丁志鸿.PDF文件中关键信息的提取与组织方法研究[J].计算机工程与设计,2007,28(7):1688-1690. 被引量：12
4张秀秀,张立峰.PDF文件文本内容提取研究[J].科技情报开发与经济,2008,18(36):118-120. 被引量：16
5黄江平,黄理灿,徐玲.基于Lucene的PDF文档的全文检索的实现[J].工业控制计算机,2012,25(5):103-104. 被引量：11
6张擂,李清宝,贾天江,周登元.基于剪贴板监控的电子文档多级保护[J].计算机与现代化,2015(6):12-18. 被引量：3
7谭咏梅,王志浩.基于多特征的中文文本蕴含识别[J].北京邮电大学学报,2015,38(6):98-103. 被引量：2
8Mehdi Ghayoumi.A Quick Review of Deep Learning in Facial Expression[J].通讯和计算机（中英文版）,2017,14(1):34-38. 被引量：2
9郭茂盛,张宇,刘挺.文本蕴含关系识别与知识获取研究进展及展望[J].计算机学报,2017,40(4):889-910. 被引量：28
10周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1751

引证文献3

1贺伟雄,柏林元,郭文娟.一种面向PDF文档的文本复制优化方法研究[J].软件,2022,43(7):63-67. 被引量：1
2王彬,向甜,吕艺东,王晓帆.基于NSGA-Ⅱ的自适应多尺度特征通道分组优化算法[J].计算机应用,2023,43(5):1401-1408.
3钟茂生,孙磊,罗贤增,王明文.融入句法结构和摘要信息的文本蕴含识别模型[J].计算机技术与发展,2023,33(10):120-127.

二级引证文献1

1赞拉公,贡保加,完玛道吉,安见才让.藏文PDF文档转换为Word文档方法[J].长江信息通信,2023,36(11):117-120.

1宋雅文,杨志豪,罗凌,王磊,张音,林鸿飞,王健.基于字符卷积神经网络的生物医学变异实体识别方法[J].中文信息学报,2021,35(5):63-69. 被引量：5
2张怡睿宸,李云峰,顾旭阳,纪淑娟.一种融合行为与结构特征推理的造假群组检测算法[J].计算机工程与科学,2021,43(5):926-935. 被引量：2
3曹建军,常宸,翁年凤,陶嘉庆,江春.基于神经网络编码的真值发现[J].计算机工程与科学,2021,43(9):1546-1557. 被引量：2

四川大学学报（自然科学版）

2021年第5期

浏览历史

内容加载中请稍等...

一种轻量级文本蕴含模型被引量：3

参考文献3

二级参考文献8

共引文献47

同被引文献24

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种轻量级文本蕴含模型 被引量：3

参考文献3

二级参考文献8

共引文献47

同被引文献24

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种轻量级文本蕴含模型被引量：3