期刊文献+

基于最大熵模型的汉语句子分析 被引量:16

Chinese Sentence Parsing Based on Maximum Entropy Model
下载PDF
导出
摘要 文中运用浅层句法分析理论 ,把汉语句子分析划分为标注、组块、构造和检查三个过程 .并针对已有概率评价模型的特征类型少 ,不能充分利用上下文中对分析有用的信息等问题 ,提出了基于最大熵的概率评价模型来评估分析过程中每个行为的概率 .在该模型中 ,对分析有用的任何信息都可以成为模型中的一个特征 ;定义了静态模板结构的特征集和训练集 ,给出了相应的特征选择策略和基于GIS的参数估计算法 ;采取BFS算法高效搜索概率值最高的候选句法树作为最终的句法分析结果 .实验结果表明 :该模型具有较高的分析效率和准确性 . The shallow parsing theory is applied to partition Chinese sentence parsing into three procedures: TAG, CHUNK, BUILD and CHECK. To resolve the problem of lacking feature types for available probabilistic models and make the best of useful information for parsing in context, we present probabilistic model based on maximum entropy to evaluate the probability of each action in the parsing procedures. In this model, any useful information for parsing in a context could be an actual feature; the features and training events are defined; the strategy of feature selection and the algorithm of parameter estimation based on Generalized Iterative Scaling (GIS) are given; The final result of parsing is the parse tree with the largest probability searched with Breadth-first search (BFS). The model is experimentally proved satisfying in both parsing efficiency and precision.
出处 《电子学报》 EI CAS CSCD 北大核心 2003年第11期1608-1612,共5页 Acta Electronica Sinica
基金 国家自然科学基金资助项目 (No .60 1 740 2 8)
关键词 自然语言处理 最大熵模型 组块 句法分析 广度优先搜索 Algorithms Entropy Mathematical models Parameter estimation Probability Trees (mathematics)
  • 相关文献

参考文献4

二级参考文献39

  • 1周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量:43
  • 2周强.一个汉语短语自动界定模型[J].软件学报,1996,7(A00):315-322. 被引量:9
  • 3孙宏林.从标注语料库中姨纳语法规则:“V+N”序列试验分析.语言工程[M].北京:清华大学出版社,1997.157-163.
  • 4[2]Darroch J N,Ratcliff D.Generalized iterative scaling for log-linear models[J].The Annals of Mathematical Statistics, 1972;43(5): 1470-1480
  • 5[3]Au R Rosenfeld. Adaptive language modeling using the maximum entropy principle[C].ln:Proceedings of the Human Language Technology Workshop ,ARPA: 1993: 108-113
  • 6[4]Rosenfeld R.A maximum entropy approach to adaptive statistical language modeling[J].Computer, Speech, and Language, 1996; 10
  • 7[5]Jaynes E T.Notes on present status and future prospects[C].ln:Grandy W T,Schick L Heds. Maximum Entropy and Bayesian Methods,Kluwer: 1990:1-13
  • 8姚天顺,自然语言理解.一种让机器懂得人类语言的研究,1995年,220页
  • 9Abney, 1996b. Partial parsing via finite-state cascades. In Proceedings of the ESSLLI '96 Robust Parsing Workshop.
  • 10Argamon, S., I. Dagon and Y. Krymolowsky. 1998. A memory-based approach to learning shallow natural language patterns. In Proceedings of COLING-ACL '98. Pp. 67-73.

共引文献58

同被引文献116

引证文献16

二级引证文献76

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部