基于树核的隐式篇章关系识别被引量：15

Implicit Discourse Relation Recognition Based on Tree Kernel

下载PDF

导出

摘要隐式篇章关系识别是篇章结构分析中最具有挑战性的任务之一.传统的方法注重篇章中的概念和意义特征,导致系统的性能不高.系统地探索了篇章中的浅层语义信息和以态度韵为导向的句子级情感等平面特征的有效性,同时提出了一种简单而有效的树核方法,最后采用复合核方法加以集成.在Penn Discourse Treebank(PDTB)2.0语料库上的实验结果表明,引入浅层语义和情感等信息后,准确率得到显著提升. As a critical sub-task in discourse structure analysis, implicit discourse relation recognition （iDRR） is a challenging natural language processing task. Traditional approaches focus on exploring concepts and sense in discourse, which result in poor performance. This paper first systematically explores the efficiency of shallow semantic and attitude prosody-driven sentence-level sentiment information in discourse. Next, the paper proposes a simple but effective tree structure and finally investigates the efficiency of a composite kernel. Evaluation on Penn Discourse Treebank （PDTB） 2.0 shows the importance of shallow semantic and sentiment information across the discourse, and the appropriateness of the composite kernel in iDRR. It also shows that this system significantly outperforms other ones currently in the research field.

作者徐凡朱巧明周国栋

机构地区苏州大学计算机科学与技术学院江苏省计算机信息处理技术重点实验室

出处《软件学报》 EI CSCD 北大核心 2013年第5期1022-1035,共14页 Journal of Software

基金国家自然科学基金(60970056 90920004) 国家高技术研究发展计划(863)(2012AA011102) 高等学校博士学科点专项科研基金(20093201110006) 江苏省自然科学基金(BK2011282) 江苏省高校自然基金(11KIJ520003) 江苏省普通高校研究生科研创新计划(CXZZ11_0101)

关键词篇章篇章结构分析隐式篇章关系识别树核复合核 discourse discourse structure analysis implicit discourse relation recognition tree kernel composite kernel

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献32

1Pitier E, Nenkova A. Using syntax to disambiguate explicit discourse connectives in text. In: Proc. of the ACL-IJCNLP 2009. Stroudsburg: Association for Computational Linguistics, 2009. 13-16.
2Wang WT, Su J, Tan CL. Kernel based discourse relation recognition with temporal ordering information. In: Proc. of the ACL 2010. Uppsala: Association for Computational Linguistics, 2010. 710-719.
3Lin ZH, Karl MY, Ng HT. Recognizing implicit discourse relations in the penn discourse treebank. In: Proc. of the EMNLP 2009. Stroudsburg: Association for Computational Linguistics, 2009. 343-351.
4Carlson L, Marcu D, Okurowski ME. Building a discourse-tagged corpus in the framework of rhetorical structure theory. In: Proc. of the SIGDIAL. Stroudsburg: Association for Computational Linguiscs, 2001. 1-10. [doi: 10.3115/1118078.1118083].
5Prasad R, Miltsakaki E, Dinesh N, Lee A, Joshi A, Robaldo L, Webber B. The penn discourse treebank 2.0 annotation manual. Technical Report, IRCS-08-01, Philadelphia: University of Pennsylvania, 2008.1-99.
6Wolf F, Gibson E. Representing discourse coherence: A corpus-based analysis. Journal of Computational Linguistics, 2005,31(2): 249-288. [doi: 10.1162/0891201054223977].
7Zhou ZM, Xu Y, Niu ZY, Lan M, Su J, Tan CL. Predicting of discourse connectives for implicit discourse relation recognition. In: Proc. of the COLING 2010. Beijing: Association for Computational Linguistics, 2010. 1507-1514.
8Pitler E, Louis A, Nenkova A. Automatic sense prediction for implicit discourse relations in text. In: Proc. of the ACL-IJCNLP 2009. Stroudsburg: Association for Computational Linguistics, 2009.683-691.
9Zhou ZM, Lan M, Niu ZY, Xu Y, Su J. The effects of discourse connectives prediction on implicit discourse relation recognition. In: Proc. of the SIGDIAL 2010. Tokyo: Association for Computational Linguistics, 2010. 139-146.
10Hernault H, Bollegala D, Ishizuka M. A semi-supervised approaeh to improve classification of infrequent discourse relations using feature vector extension. In: Proc. of the EMNLP 2010. Massachusetts: Association for Computational Linguistics, 2010. 399-409.

同被引文献113

1周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
2程晓堂.从主位结构看英语作文的衔接与连贯[J].山东师大外国语学院学报,2002(2):94-98. 被引量：44
3王跃洪.英语句群分析[J].上海理工大学学报（社会科学版）,2004,26(2):30-32. 被引量：6
4王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量：36
5崔耀,陈永明.一个实验性的汉语篇章理解系统[J].中文信息学报,1994,8(3):24-34. 被引量：3
6袁毓林.用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用[J].中文信息学报,2005,19(4):39-45. 被引量：6
7王建波,杜春玲,王开铸.基于篇章理解的自动文摘研究[J].中文信息学报,1995,9(3):33-42. 被引量：12
8罗天妮.论以句群为汉英翻译的有效基本单位[J].东南大学学报（哲学社会科学版）,2006,8(3):110-113. 被引量：3
9周俊生,黄书剑,陈家骏,曲维光.一种基于图划分的无监督汉语指代消解算法[J].中文信息学报,2007,21(2):77-82. 被引量：19
10朱靖波,叶娜,罗海涛.基于多元判别分析的文本分割模型[J].软件学报,2007,18(3):555-564. 被引量：15

引证文献15

1涂眉,周玉,宗成庆.基于最大熵的汉语篇章结构自动分析方法[J].北京大学学报（自然科学版）,2014,50(1):125-132. 被引量：9
2孙成,孔芳.基于转移的中文篇章结构解析研究[J].中文信息学报,2018,32(12):48-56. 被引量：5
3徐凡,朱巧明,周国栋,王明文.衔接性驱动的篇章一致性建模研究[J].中文信息学报,2014,28(3):11-21. 被引量：1
4王荣波,李杰,黄孝喜,周昌乐,谌志群,王小华.基于多元判别分析的汉语句群自动划分方法[J].计算机应用,2015,35(5):1314-1319. 被引量：4
5周建成,吴铤,王荣波,常若愚.基于LIBSVM的“就是”句句间关系判别方法[J].计算机应用,2015,35(7):1950-1954.
6朱珊珊,洪宇,丁思远,严为绒,姚建民,朱巧明.基于训练样本集扩展的隐式篇章关系分类[J].中文信息学报,2016,30(5):111-120. 被引量：3
7褚晓敏,朱巧明,周国栋.自然语言处理中的篇章主次关系研究[J].计算机学报,2017,40(4):842-860. 被引量：23
8郑江龙,陈锦秀.基于混合树结构神经网络的隐式篇章关系识别[J].厦门大学学报（自然科学版）,2017,56(4):576-583.
9周明,贾艳明,周彩兰,徐宁.基于篇章结构的英文作文自动评分方法[J].计算机科学,2019,46(3):234-241. 被引量：15
10田文洪,高印权,黄厚文,黎在万,张朝阳.基于多任务双向长短时记忆网络的隐式句间关系分析[J].中文信息学报,2019,33(5):47-53. 被引量：7

二级引证文献71

1褚晓敏,奚雪峰,蒋峰,徐昇,朱巧明,周国栋.宏观篇章结构表示体系和语料建设[J].软件学报,2020,31(2):321-343. 被引量：5
2阮慧彬,孙雨,洪宇,吴成豪,李晓,周国栋.基于图卷积神经网络的隐式篇章关系识别[J].中文信息学报,2021,35(8):28-37.
3孙凯丽,邓沌华,李源,李妙,李洋.基于句内注意力机制多路CNN的汉语复句关系识别方法[J].中文信息学报,2020(6):9-17. 被引量：10
4赵文仓,陈聪聪,郑鸿磊.基于SSU-SGD的动态手持物体识别[J].计算机应用研究,2020,37(2):621-624.
5钟守满,吴安萍.语义关系研究及其学科跨界视阈分析方法[J].外语教学,2015,36(3):9-12. 被引量：4
6吕国英,苏娜,李茹,王智强,柴清华.基于框架的汉语篇章结构生成和篇章关系识别[J].中文信息学报,2015,29(6):98-109. 被引量：2
7王荣波,张璐瑶,李杰,黄孝喜,周昌乐.基于句群的自动文摘方法[J].计算机应用,2016,36(A01):58-62. 被引量：2
8骆蓉,钟守满.跨学科视角的语义关系研究[J].外语教学,2016,37(5):5-10. 被引量：1
9严为绒,徐扬,朱珊珊,洪宇,姚建民,朱巧明.篇章关系分析研究综述[J].中文信息学报,2016,30(4):1-11. 被引量：6
10曾军,周国富.基于机器学习的多语言文本抽取系统实现[J].计算机应用与软件,2017,34(4):87-92. 被引量：4

1刘初,陈锦秀.基于组合特征的自训练隐式篇章关系的识别技术[J].厦门大学学报（自然科学版）,2014,53(2):182-189. 被引量：4
2孙静,李艳翠,周国栋,冯文贺.汉语隐式篇章关系识别[J].北京大学学报（自然科学版）,2014,50(1):111-117. 被引量：15
3贾震斌.最大熵分类算法在隐式篇章关系识别中的应用[J].福建电脑,2010,26(11):1-2.
4吴方磊,李军辉,朱巧明,李培峰.基于树核函数的中文语义角色分类研究[J].中文信息学报,2011,25(3):51-58. 被引量：3
5吴方磊,李军辉,朱巧明,李培峰.中文语义角色标注的树核空间研究[J].计算机应用与软件,2012,29(3):58-61.
6张志昌,张宇,刘挺,李生.基于浅层语义树核的阅读理解答案句抽取[J].中文信息学报,2008,22(1):80-86. 被引量：14
7蒋强荣,张鸿宾,路倩倩.基于生成树的人脸识别[J].北京工业大学学报,2012,38(1):110-114. 被引量：1
8王朔琛,汪西莉.参数自适应的半监督复合核支持向量机图像分类[J].计算机应用,2015,35(10):2974-2979. 被引量：3
9熊皓,刘洋,刘群.模糊匹配在树到串翻译模型中的应用[J].中文信息学报,2011,25(2):66-71. 被引量：1
10化柏林.基于NLP的知识抽取系统架构研究[J].现代图书情报技术,2007(10):38-41. 被引量：16

软件学报

2013年第5期

浏览历史

内容加载中请稍等...

基于树核的隐式篇章关系识别被引量：15

参考文献32

同被引文献113

引证文献15

二级引证文献71

相关作者

相关机构

相关主题

浏览历史

基于树核的隐式篇章关系识别 被引量：15

参考文献32

同被引文献113

引证文献15

二级引证文献71

相关作者

相关机构

相关主题

浏览历史

基于树核的隐式篇章关系识别被引量：15