摘要
句式结构树库是以句本位语法为理论基础构建的句法资源,对汉语教学以及句式结构自动句法分析等研究具有重要意义。目前已有的句式结构树库语料主要来源于教材领域,其他领域的标注数据较为缺乏,如何高效地扩充高质量的句法树库是值得研究的问题。人工标注句法树库费时费力,树库质量也难以保证,为此,该文尝试通过规则的方法,将宾州中文树库(CTB)转换为句式结构树库,从而扩大现有句式结构树库的规模。实验结果表明,该文提出的基于树库转换规则的方法是有效的。
Sentence pattern structure treebank is developed according to the theory of sentence-based grammar,which is of great significance to Chinese teaching.To further expand such treebank from Chinese as second language textbooks and Chinese textbooks to other domains,we propose a rule-based method to convert a phrase structure treebank named Penn Chinese Treebank(CTB)into a sentence pattern structure treebank so as to increase the size of the existing treebank.The experimental results show that our proposed method is effective.
作者
谢晨晖
胡正升
杨麟儿
廖田昕
杨尔弘
XIE Chenhui;HU Zhengsheng;YANG Lin'er;LIAO Tianxin;YANG Erhong(National Language Resources Monitoring and Research Center Print Media LanguageBranch,Beijing Language and Culture University,Beijing 100083,China;School of Information Science,Beijing Language and Culture University,Beijing 100083,China;Advanced Innovation Center for Language Resources,Beijing Languageand Culture University,Beijing 100083,China)
出处
《中文信息学报》
CSCD
北大核心
2023年第2期15-25,共11页
Journal of Chinese Information Processing
基金
国家语委项目(ZDI135-131)
中外语言交流合作中心《国际中文教育中文水平等级标准》教学资源建设项目(YHJC21YB-129)
中央高校基本科研业务费(北京语言大学梧桐创新平台,21PT04)
北京语言大学研究生创新基金(中央高校基本科研业务费专项资金)项目成果(22YCX086)。
关键词
句式结构
短语结构
树库构建
sentence pattern structure
phrase structure
treebank construction