期刊文献+

匹配树和决策树方法识别英语句子中的BaseNP 被引量:2

USING MATCHING TREE AND DECISION TREES TO IDENTIFY BaseNP IN ENGLISH SENTENCES
下载PDF
导出
摘要 提出了语料库和机器学习相结合的方法识别英语句子中的简单的、非递归的名词短语 (Base NP) .在含有词性标注和 Base NP边界标注的训练语料中 ,抽取所有不同类型 Base NP短语对应的词性序列 (Base NP规则 ) ,通过规则排序和语言学知识 ,对其中正确率低且明显不符合语法的规则进行剔除 .在识别时 ,采取规则匹配树的方法进行最大长度匹配 ,通过归纳机器学习 C4.5算法引入上下文信息 ,由 C4.5算法学习出有效 (或无效 )应用 Base NP规则的条件 ,参照上下文条件 ,约束应用 Base NP规则 .实验结果表明 ,提出的方法具有很高的正确率和召回率 . A new method, which combines the corpus approach with the machine learning approach, is put forward in this paper to identify simple, non recursion noun phrases (BaseNP). Firstly, all different part of speech (POS) strings (BaseNP rules) which are corresponding to BaseNP are extracted from the training corpus tagged with POS and the boundary of each BaseNP. By means of training and based on linguistics knowledge, some BaseNP rules which have lower precision and have no linguistics sense apparently are deleted. Secondly, the remaining BaseNP rules are employed to identify BaseNP in new sentences. In the process, a heuristic algorithm of longest match, which is combined with the machine learning method of inductive decision trees to consult contexts, is applied. Experiments show that this new method results in higher precision and recall precision.
出处 《计算机研究与发展》 EI CSCD 北大核心 2000年第7期826-832,共7页 Journal of Computer Research and Development
基金 国家自然科学基金 国家"八六三"高技术研究发展计划基金
关键词 BaseNP 匹配树 决策树 英语句子 自然语言处理 BaseNP, noun phrase, matching tree, decision tree
  • 相关文献

参考文献1

  • 1周强,博士学位论文,1996年

同被引文献12

  • 1张仰森,俞士汶.文本自动校对技术研究综述[J].计算机应用研究,2006,23(6):8-12. 被引量:39
  • 2周强.汉语语料库的短语自动划分和标注研究[M].北京:北京大学,1996..
  • 3李秀坤.汉字文本自动查错系统的研究与实现[M].哈尔滨:哈尔滨工业大学计算机系,1995..
  • 4Kukich K. Techniques for Automatically Correcting Words in Text[J ]. ACM Computing Surveys 1992,24(4) :377-439.
  • 5刘群 张华平 俞鸿魁 等.基于层次的隐马尔可夫模型汉语词法分析.2003,15(3):31-40.
  • 6马金山,刘挺,李生.基于n-gram及依存分析的中文自动查错方法[M].哈尔滨工业大学计算机学院信息检索研究室,2003.33-42.
  • 7张仰森 丁冰青.中文文本自动校对技术现状及展望.中文信息学报,1997,15(7):47-50.
  • 8荀恩东,计算机研究与发展,2000年,11卷,4期,473页
  • 9周强,学位论文,1996年
  • 10李秀坤,学位论文,1995年

引证文献2

二级引证文献15

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部