基于语言现象的文本蕴涵识别被引量：4

Recognizing Textual Entailment Based on Inference Phenomena

下载PDF

导出

摘要该文提出一种基于语言现象的文本蕴涵识别方法,该方法建立了一个语言现象识别和整体推理判断的联合分类模型,目的是对两个高度相关的任务进行统一学习,避免管道模型的错误传播问题并提升系统精度。针对语言现象识别,设计了22个专用特征和20个通用特征;为提高随机森林的泛化能力,提出一种基于特征选择的随机森林生成算法。实验结果表明,基于随机森林的联合分类模型能够有效识别语言现象和总体蕴涵关系。 This paper introduces an approach of textual entailment recognition based on language phenomena. The approach asopts a joint classification model for language phenomenon recognition and entailment recognition, so as to learn two highly relevant tasks, avoiding error propagation in pipeline strategy. For language phenomenon recogni tion, 22 specific and 20 general features are employed. And for enhancing the generalization of random forest, a feature selection method is adopted on building trees of random forest. Experimental results show that the joint classification model based on random forest recognizes language phenomena and entailment relation effectively.

作者任函冯文贺刘茂福万菁

机构地区广东外语外贸大学语言工程与计算实验室武汉大学湖北语言与智能信息处理研究基地武汉科技大学计算机学院广东外语外贸大学词典研究中心

出处《中文信息学报》 CSCD 北大核心 2017年第1期184-191,共8页 Journal of Chinese Information Processing

基金国家自然科学基金(61402341) 国家社会科学基金(11&ZD189) 华中师范大学中央高校基本科研业务费教育科学专项资助(ccnu16JYKX014) 教育部人文社科项目(13YJC740022) 河南高校哲社基础研究重大项目(2015-JCZD-022) 广东外语外贸大学语言工程与计算实验室2016年招标课题(LEC2016ZBKT002)

关键词文本蕴涵识别语言现象随机森林 recognizing textual entailment language phenomena random forest

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1江敏,肖诗斌,王弘蔚,施水才.一种改进的基于《知网》的词语语义相似度计算[J].中文信息学报,2008,22(5):84-89. 被引量：109
2张志昌,周慧霞,姚东任,鲁小勇.基于词向量的中文词汇蕴涵关系识别[J].计算机工程,2016,42(2):169-174. 被引量：7

二级参考文献25

1夏天,樊孝忠,刘林,骆正华.基于ALICE的汉语自然语言接口[J].北京理工大学学报,2004,24(10):885-889. 被引量：11
2吴健,吴朝晖,李莹,邓水光.基于本体论和词汇语义相似度的Web服务发现[J].计算机学报,2005,28(4):595-602. 被引量：218
3朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
4何娟,高志强,陆青健,瞿裕忠.基于词汇相似度的元素级本体匹配[J].计算机工程,2006,32(16):185-187. 被引量：25
5李峰,李芳.中文词语语义相似度计算——基于《知网》2000[J].中文信息学报,2007,21(3):99-105. 被引量：106
6刘群,李素建.基于《知网》的词汇语义相似度的计算[C].台北:第三届汉语词汇语义学研讨会,2002.
7董振东,董强.知网[DB/OL],http://www.keenage.com.
8Dekang Lin. An Information-Theoretic Definition of Similarity Semantic distance in WordNet [C]//Proceedings of the Fifteenth International Conference on Machine Learning. 1998.
9Eneko Agirre, German Rigau. A Proposal for Word Sense Disambiguation using Conceptual Distance[C]// Proceedings of the First International Conference on Recent Advanced in NLP. 1995.
10BUDANITSKY, A. AND HIRST, G. Semantic distance in WordNet: An experimental, application-oriented evaluation of five measures [C]//Workshop on WordNet and Other Lexical Resources, Second meeting of the North American Chapter of the Association for Computational Linguistics. 2001.

共引文献114

1张培颖.基于句子特征和语义距离的文本摘要技术[J].微计算机应用,2009,30(7):14-18. 被引量：3
2杨昱昺,吴贤伟.改进的基于知网词汇语义褒贬倾向性计算[J].计算机工程与应用,2009,45(21):91-93. 被引量：15
3蒋溢,丁优,熊安萍,王化晶.一种基于知网的词汇语义相似度改进计算方法[J].重庆邮电大学学报（自然科学版）,2009,21(4):533-537. 被引量：22
4赵应秋,罗军,张君艳.基于知网的词语语义相关度计算[J].信息技术,2010,34(3):90-93. 被引量：6
5吴奎,周献中,王建宇,赵佳宝.基于贝叶斯估计的概念语义相似度算法[J].中文信息学报,2010,24(2):52-57. 被引量：12
6张振幸,李金厚.一种基于义原重合度的词语相似度计算[J].信阳师范学院学报（自然科学版）,2010,23(2):296-299. 被引量：4
7刘汉兴,刘财兴,林旭东.基于问句相似度的本体问答系统[J].广西师范大学学报（自然科学版）,2010,28(1):88-91. 被引量：4
8谈文蓉,冯山,刘莉.语义分析在汉语相似性文献检测中的应用研究[J].四川师范大学学报（自然科学版）,2010,33(4):554-558. 被引量：1
9张培颖.多特征融合的语句相似度计算模型[J].计算机工程与应用,2010,46(26):136-137. 被引量：19
10葛斌,李芳芳,郭丝路,汤大权.基于知网的词汇语义相似度计算方法研究[J].计算机应用研究,2010,27(9):3329-3333. 被引量：66

同被引文献29

1张绍杰,杨忠.论语用等同[J].现代外语,1993,16(2):16-20. 被引量：6
2何兆熊.语用、意义和语境[J].外国语,1987,10(5):10-14. 被引量：123
3徐盛桓.话语的含意性[J].外语研究,1996(3):2-9. 被引量：39
4吴友政,赵军,段湘煜,徐波.问答式检索技术及评测研究综述[J].中文信息学报,2005,19(3):1-13. 被引量：48
5冉永平.词汇语用信息的临时性及语境构建[J].外语教学,2008,29(6):1-6. 被引量：35
6赵世奇,刘挺,李生.复述技术研究[J].软件学报,2009,20(8):2124-2137. 被引量：14
7王宁.论词的语言意义的特性[J].北京师范大学学报（社会科学版）,2011(2):35-42. 被引量：19
8戴耀晶.句子语用意义的提取[J].当代修辞学,2011(2):11-17. 被引量：3
9庞杨,张绍杰.词汇同义关系的认知关联解读[J].外语学刊,2012(4):85-89. 被引量：10
10黄衍,查伟雄.随机森林与支持向量机分类性能比较[J].软件,2012,33(6):107-110. 被引量：71

引证文献4

1马天欢.语用视角下复述句生成方式的类型考察[J].中文信息学报,2021,35(10):32-38.
2任函.基于推理现象识别的答案抽取[J].湖北科技学院学报,2017,37(4):132-135. 被引量：2
3刘广灿,曹宇,许家铭,徐波.基于对抗正则化的自然语言推理[J].自动化学报,2019,45(8):1455-1463. 被引量：4
4严明,刘茂福,胡慧君.基于多层注意力机制的中文文本蕴涵识别方法[J].计算机工程与设计,2020,41(8):2289-2295. 被引量：1

二级引证文献7

1王征强.大比例尺数字测图精度与测距长度之关系浅析[J].测绘通报,2000(4):32-33. 被引量：10
2张志昌,曾扬扬,庞雅丽.融合语义角色和自注意力机制的中文文本蕴含识别[J].电子学报,2020,48(11):2162-2169. 被引量：9
3于强,徐志栋,时斌,魏伟,任鹏程.基于事理知识图谱的舆情推演方法[J].计算机系统应用,2021,30(4):25-31. 被引量：2
4张磊.人工智能背景下计算机自然语言的处理[J].新一代信息技术,2020,3(17):44-47. 被引量：1
5潘红丽.基于RNN弱监督网络的英语语义分析技术研究[J].电子设计工程,2021,29(15):97-101. 被引量：4
6杨东,李丹.基于BoTNet的车辆分类实现[J].电子测试,2021,32(24):57-59.
7徐健,职燕,刘源.基于PSO优化孪生支持向量机的自然语言处理[J].南京理工大学学报,2023,47(1):103-108. 被引量：2

1盛雅琦,张晗,吕晨,姬东鸿.基于混合主题模型的文本蕴涵识别[J].计算机工程,2015,41(5):180-184. 被引量：2
2任函,盛雅琦,冯文贺,刘茂福.基于知识话题模型的文本蕴涵识别[J].中文信息学报,2015,29(6):119-126. 被引量：4
3刘茂福,李妍,顾进广.基于统计与词汇语义特征的中文文本蕴涵识别[J].计算机工程与设计,2013,34(5):1777-1782. 被引量：4
4倪盛俭,姬东鸿.基于图式的文本蕴涵识别初探[J].中文信息学报,2015,29(3):82-87.
5张晗,盛雅琦,吕晨,姬东鸿.基于短文本隐含语义特征的文本蕴涵识别[J].中文信息学报,2016,30(3):163-171. 被引量：3
6刘茂福,王月,顾进广.基于语义规则的中文矛盾关系识别方法[J].计算机工程与科学,2015,37(4):806-812. 被引量：3
7张志昌,姚东任,刘霞,陈松毅,鲁小勇.融合句法结构变换与词汇语义特征的文本蕴涵识别[J].计算机工程,2015,41(9):199-204. 被引量：5
8李妍,刘茂福,姬东鸿.基于支持向量机的中文文本蕴涵识别研究[J].计算机应用与软件,2014,31(4):51-55. 被引量：9
9洪家荣.知识发现的理论及其实现[J].自动化学报,1993,19(6):663-669. 被引量：3
10李建民,谢丽明.基于模糊概念格的入侵检测算法[J].黑龙江科技信息,2011(27):36-36.

中文信息学报

2017年第1期

浏览历史

内容加载中请稍等...

基于语言现象的文本蕴涵识别被引量：4

参考文献2

二级参考文献25

共引文献114

同被引文献29

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于语言现象的文本蕴涵识别 被引量：4

参考文献2

二级参考文献25

共引文献114

同被引文献29

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于语言现象的文本蕴涵识别被引量：4