期刊文献+

基于形态分析的现代维吾尔语名词词干识别研究 被引量:4

Morphological Analysis Based Noun Stem Identification for Modern Uyghur
下载PDF
导出
摘要 现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究,主要目的是从句子中提取名词词干,提高名词识别效率。首先陈述形态分析概念,通过这些形态特征可以准确地识别其词性的意义;其次讨论维吾尔语的词类划分标准、名词的形态特征分析,总结词缀歧义及消解规则;该文提出研究总体思路,设计现代维吾尔语新词中名词识别算法,其中包括特征选择及参数估计、词内部特征、前后依存词特征等;最后将初中、高中物理维吾尔语教材作为验证对象,对名词词干进行统计与分析。 Modern Uyghur noun stem identification is a fundamental issue in the field of natural language processing. The morphological analysis is first introduced, especially on its role in identifying the POS of words. Then this paper describes the POS scheme in Uyghur, as well as the morphological characteristics of Uyghur nouns, suffix ambiguity and the disambiguation rules. The algorithm of new nouns identification in modern Uyghur language is pro posed, including feature selection (features within and between words) and parameter estimation. The experiment is carried on the corpus of Uyghur physical textbooks in junior and senior middle schools.
出处 《中文信息学报》 CSCD 北大核心 2015年第6期208-212,共5页 Journal of Chinese Information Processing
基金 新疆维吾尔自治区自然科学基金(2014211A045) 新疆维吾尔自治区哲学社会科学研究规划基金(14CYY093) 教育部人文社会科学一般项目(14YJC740001) 新疆维吾尔自治区高校科研计划青年教师科研启动基金(20140706213103147) 国家自然科学基金(61132009 61262066) 国家社科基金(14AZD11)
关键词 现代维吾尔语 形态分析 名词词干识别 modern Uyghur morphological analysis noun stems recognition
  • 相关文献

参考文献9

二级参考文献62

  • 1苏新春.关于《现代汉语词典》词汇计量研究的思考[J].世界汉语教学,2001,15(4):39-47. 被引量:19
  • 2玉素甫.艾白都拉,阿布都热依木.沙力.现代维语语料库的词类标注研究[J].民族语文,2005(4):63-66. 被引量:7
  • 3苏新春.对外汉语词汇大纲与两种教材词汇状况的对比研究[J].语言文字应用,2006(2):103-111. 被引量:37
  • 4苏新春,杨尔弘.2005年度汉语词汇统计的分析与思考[J].厦门大学学报(哲学社会科学版),2006,56(6):84-91. 被引量:13
  • 5[2]Chen Wenliang,Chang Xingzhi,Wang Huizhen,et al.Automatic word clustering for text categorization using global information.AIRS2004,Beijing,2004
  • 6[3]Adwait Ratnaparkhi.A maximum entropy model for part-of-speech tagging.Conf on Empirical Methods in Natural Language Processing,University of Pennsylvania,1996
  • 7[4]Steven J Benson,Jorge J More.A limited-memory variable-metric method for bound-constrained minimization.Mathematics and Computer Science Division,Argonne National Laboratory,Tech Rep ANL/MCS-P909-0901,2001
  • 8[5]Stanley F Chen,Ronald Rosenfeld.A Gaussian priori for smoothing maximum entropy models.Computer Science Department,Carnegie Mellon University,Tech Rep CMU-CS-99-108,1999
  • 9[6]Fabrizio Sebastiani.Machine learning in automated text categorization.ACM Computing Surveys,2000,34(1):1-47
  • 10[7]Jinying Chen,NianWen Xue,Martha Palmer.Using a smoothing maximum entropy model for chinese nominal entity tagging.The 1st Int'l Joint Conf on Natural Language Processing,Hainan Island,2004

共引文献54

同被引文献57

引证文献4

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部