摘要
篇章关系研究,旨在推断同一篇章内相邻或跨度在一定范围内的文本片段之间的语义连接关系。语义连接关系对篇章内容理解和结构分析都具有重要作用,成为目前篇章分析领域的重点研究内容。该文针对三个中英文篇章关系研究领域的语料库:基于修辞结构理论的篇章树库(Rhetorical Structure Theory Discourse Treebank,RSTDT)、宾州篇章树库(Penn Discourse Treebank,PDTB)和哈尔滨工业大学中文篇章关系语料库(HIT Chinese Discourse Treebank,HIT-CDTB),主要介绍篇章关系分析理论的语料资源与研究背景、标注与评测体系以及国内外研究现状。此外,总结相关工作,指出目前篇章关系,尤其是隐式篇章关系研究的主要难题。
The research on discourse relation is aimed at inferring the inter-sentential semantic relationship which occurs in the same discourse.This relation plays an important role in discourse content understanding and structure analyzing,becoming research focus in the field of discourse analysis.In this paper,we introduce the corpus and background,annotation and evaluation system as well as in this field based three corpora:Rhetorical Structure Theory Discourse Treebank(RSTDT),Penn Discourse Treebank(PDTB)and HIT Chinese Discourse Treebank(HITCDTB).Finally,through analyzing current work,we summarize the main difficulty and challenge in recognizing discourse relation especially implicit discourse relation.
作者
严为绒
徐扬
朱珊珊
洪宇
姚建民
朱巧明
YAN Weirong XU Yang ZHU Shanshan HONG Yu YAO Jianmin ZHU Qiaoming(School of Computer Science and Technology, Soochow University, Suzhou, Jiangsu 215006, China)
出处
《中文信息学报》
CSCD
北大核心
2016年第4期1-11,共11页
Journal of Chinese Information Processing
基金
国家自然科学基金(61373097
61272259
61272260
90920004)
教育部博士学科点专项基金(2009321110006
20103201110021)
江苏省自然科学基金(BK2011282)
江苏省高校自然科学基金(11KJA520003)
苏州市自然科学基金(SH201212)