期刊文献+

基于最大熵的维吾尔语句子边界识别模型 被引量:7

Uyghur Sentence Boundary Identification Model Based on Maximum Entropy
下载PDF
导出
摘要 采用最大熵模型实现维吾尔语句子边界识别,该模型的训练过程不需要提供手工收集规则、词性标注及形态分析,仅使用较容易获取的单词长度和音节等特征。为确定最佳特征模板,在特征空间上组合出不同特征模板进行测试。实验结果表明,最佳特征模板具有较强的鲁棒性,召回率可达97.72%。 The Maximum Entropy(ME) model is used to detect Uyghur sentence boundary. The training procedure does not require hand-crafted rules, parl-of-speech tags, or morphological information, but uses readily available features, such as word length and syllable. To determine the best feature set, tests are performed on the different combinations of features. Experimental results show the best feature set is quite robust, and achieves recall of 97.72%.
出处 《计算机工程》 CAS CSCD 北大核心 2010年第6期24-26,38,共4页 Computer Engineering
基金 国家自然科学基金资助项目(60663006) 新疆维吾尔自治区高技术计划基金资助项目(200712109) 新疆维吾尔自治区高校科研计划基金资助重点项目(XJEDU2008I08)
关键词 维吾尔语 句子边界识别 特征选择 最大熵 Uyghur sentence boundary identification feature selection Maximum Eatropy(ME)
  • 相关文献

参考文献7

  • 1Pahner D. Adaptive Sentence Boundary Disambiguation[C]//Proc. of the 1994 Conference on Applied Natural Language Processing. [S. l.]: IEEE Press, 1994.
  • 2Jeffrey C. A Maximum Entropy Approach to Identifying Sentence Boundaries[C]//Proceedings of the 1997 Conference on Applied Natural Language Processing. Washington D. C., USA: [s. n.], 1997.
  • 3阿比达.吾买尔,吐尔根.依布拉音.维吾尔语句子边界识别算法的设计与实现[J].新疆大学学报(自然科学版),2008,25(3):360-363. 被引量:10
  • 4AdamL B. A Maximum Entropy Approach to Natural Language Processing[J]. Computational Linguistics, 1996, 22(1): 39-71.
  • 5贾宁,张全.基于最大熵模型的中文姓名识别[J].计算机工程,2007,33(9):31-33. 被引量:5
  • 6哈密提·铁木尔.现代维吾尔语语法[M].北京:民族出版社,1987.
  • 7Darroch J. Generlized Iterative Scaling for Loglinear Models[J]. Annals of Mathematical Statistics, 1972, 43(5): 1470-1480.

二级参考文献12

共引文献18

同被引文献50

引证文献7

二级引证文献32

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部