摘要
英语句子边界的识别是英文文本分析的基本问题 ,是进一步进行英汉机器翻译的基础。本文采用了统计决策树与错误驱动相结合的方法进行英语句子边界的识别 ,首先通过决策树学习训练语句中的句子划分规则 ,之后用错误驱动的方法对所获得的结果进一步修正 ,对 Penn Tree-Bank语句进行测试 ,正确率达到 98.6 %。
Sentence boundary identification is essential to English text analysis and machine translation. This paper proposes a strategy that combines decision tree with error-driven method to labeling English sentence boundaried. It achieves 98.6% accuracy over part of Penn TreeBank texts.
出处
《微处理机》
2003年第1期30-34,共5页
Microprocessors