-
题名短语结构树库向依存结构树库转化研究
被引量:12
- 1
-
-
作者
李正华
车万翔
刘挺
-
机构
哈尔滨工业大学计算机科学与技术学院信息检索研究室
-
出处
《中文信息学报》
CSCD
北大核心
2008年第6期14-19,共6页
-
基金
自然科学基金资助项目(60675034
60575042)
国家863计划资助项目(2006AA01Z145)
-
文摘
汉语依存树库的建设相对其他语言如英语,在规模和质量上还有一些差距。树库标注需要付出很大的人力物力,并且保证树库质量也比较困难。该文尝试通过规则和统计相结合的方法,将宾州汉语短语树库PennChinese Treebank转化为哈工大依存树库HIT-IR-CDT的体系结构,从而增大现有依存树库的规模。将转化后的树库加入HIT-IR-CDT,训练和测试依存句法分析器的性能。实验表明,加入少量经转化后的树库后,依存句法分析器的性能有所提高;但加入大量树库后,性能反而下降。经过细致分析,作为一种利用多种树库提高依存句法分析器性能的方法,短语转依存还存在很多需要深入研究的方面。
-
关键词
计算机应用
中文信息处理
短语结构树库
依存结构树库
依存句法分析
-
Keywords
computer application
Chinese information processing
constituent-based treebank
dependency treebank
dependency parsing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名语言学研究中的树库建设及其应用
被引量:1
- 2
-
-
作者
刘磊
-
机构
北京外国语大学中国外语教育研究中心
燕山大学外国语学院
-
出处
《燕山大学学报(哲学社会科学版)》
2014年第1期125-130,共6页
-
基金
燕山大学青年教师自主研究计划课题"基于依存树库的链语法词典构建"(13SKA007)
-
文摘
树库是一种经过句法标注的语言资源,其中包含丰富的词汇、句法和语义知识。因此,近年来基于树库的语言学研究逐渐增多。文章概述了当前树库研究的建库方法和应用范围,内容涉及树库的标注、存储和检索以及树库在计算语言学和理论语言学中的应用。最后指出了现有研究的不足和亟待解决的问题,以及如何拓展基于树库的语言学研究。
-
关键词
短语结构树库
依存树库
树库标注
树库检索
树库应用
-
分类号
H08
[语言文字—语言学]
-