期刊文献+

汉语概率型上下文无关语法的自动推导 被引量:7

AN INFERENCE APPROACH FOR CHINESE PROBABILISTIC CONTEXT-FREE GRAMMAR
下载PDF
导出
摘要 本文提出了一种汉语概率型上下文无关语法(PCFG)的自动推导方法,它在匹配分析机制上实现了无指导的EM迭代训练算法,并通过对训练语料的自动短语界定预处理以及在集成不同知识源基础上构造合适的初始规则集,保证了训练算法能迅速收敛于符合语言事实的规则概率分布状态.初步的实验结果显示出目前的算法在训练效率和训练结果可信度方面都是令人满意的. This paper proposes a new inference approach for Chinese probabilisticcontext-free grammar, which implements the EM algorithm based on the bracketmatching schemes. Two characteristics of the algorithm are as follows: 1) To pre-process the training texts with automatic constituent boundary prediction tools,which can provide stronger syntactic restriction upon training texts in lower compu-tational costs; 2) To develop an initial rule set by integrating different knowledgeresources, including a set of basic syntactic rules generated by an automatic gram-mar construction t00l and a set of special rules summarized by linguists or extractedfrom treebanks, and provide a better initialization for the learning process. There-fore, a linguistically-motivated and broad-coverage Chinese PCFG rule set can beeasily generated through this algorithm. Current experimental results prove goodlearning efficiency of this algorithm and high reliability of the generated rule set.
作者 周强 黄昌宁
出处 《计算机学报》 EI CSCD 北大核心 1998年第5期385-392,共8页 Chinese Journal of Computers
基金 国家自然科学重点基金 中国博士后科学基金
关键词 语法推导 PCFG 语料库语言学 语言信息处理 Probabilistic context-free grammar, expectation-maximization algorithm, grammar inference
  • 相关文献

参考文献7

  • 1周强,俞士汶.汉语短语标注标记集的确定[J].中文信息学报,1996,10(4):1-11. 被引量:35
  • 2周强,智能技术与系统国家重点实验室:技术报告TR-97001,1997年
  • 3周强,语言工程,1997年,194页
  • 4周强,Proc ICCC’96,1996年,75页
  • 5周强,软件学报,1996年,7卷,增刊,315页
  • 6周强,博士学位论文,1996年
  • 7Shih H H,Comput Speech Lang,1995年,9卷,3期,235页

二级参考文献8

  • 1周明,黄昌宁.面向语料库标注的汉语依存体系的探讨[J].中文信息学报,1994,8(3):35-52. 被引量:40
  • 2周强,计算机研究与运用,1993年
  • 3李子云,汉语句法规则,1992年
  • 4房玉清,实用汉语语法,1992年
  • 5吴竞存,现代汉语句法结构与分析,1992年
  • 6范晓,汉语的短语,1991年
  • 7团体著者,世界汉语教学,1989年,1期
  • 8朱德熙,语法答问,1985年

共引文献34

同被引文献59

引证文献7

二级引证文献61

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部