摘要
统计模型的选择是统计句法分析的关键。目前句法分析常用的有四种经典统计模型—PCFG模型 ,基于历史模型、分层渐近式模型和头驱动模型。本文通过实验 ,在已有的 10 0 0 0句汉语树库基础上 ,测试了这四种经典模型在现有数据规模下各自的性能 ,并论述了这四种经典模型的各自特点。本文旨在通过对四种基本模型的比较研究 ,为具体应用中句法分析模型的选择提供参考和依据。
Choosing the statistical model is the key problem in statistical parsing. Statistical model lies in the core of NLP parsing. This paper investigates 4 primary statistical parsing models, namely PCFG, history-based model, cascading parsing model and head-driven parsing model, and compares their performances in a 10000 Chinese treebank. The analysis based on the experiment were shown in the paper. The comparative study of these models can be exploited to build the practical and effective Chinese parser.
出处
《中文信息学报》
CSCD
北大核心
2003年第3期1-8,共8页
Journal of Chinese Information Processing
基金
国家自然科学基金资助项目 ( 69775 0 17)
国家"八六三"高技术研究发展计划基金资助项目( 863- 30 6- 12 0 0 1AA11410 1)
关键词
计算机应用
中文信息处理
统计句法分析
基本模型
汉语分析
computer application
Chinese information processing
statistical parsing
primary statistical models
Chinese parsing