摘要
提出一种混合的汉语基本名词短语(BaseNP)识别模型,包括采用语法规则、统计方法和组合分类器方法。利用BaseNP词的信息、词性信息及上下文句法信息,构建组合分类器,提高判断的准确性。在中文树库(CTB5.0)上进行实验,F值达到了90.09%,证明该方法能有效地识别BaseNP。
This paper proposes a hybrid method to recognize Chinese Base Noun Phrase(BaseNP),including the use of grammer rules,statistical approach and classification combination.It utilizes words information,part of speech information and context syntax information of BaseNP,generates a combination classification and improves the precision.Experimental results on CTB5.0 show that the F-score is 90.09%,it proves that the method is an effective approach to Chinese BaseNP recognition.
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第20期199-201,共3页
Computer Engineering
基金
国家自然科学基金资助项目(0673041)
国家"863"计划基金资助项目(006AA01Z147)
关键词
基本名词短语
规则模板
组合分类器
Base Noun Phrase(BaseNP)
rule templates
combined classifier