期刊文献+

基于规则的哈萨克语基本名词短语识别研究 被引量:4

Kazakh basic noun phrase recognition based on rules
下载PDF
导出
摘要 以哈萨克语基本名词短语识别为目标,采用基于规则的方法,从基本名词短语结构语法模型出发,利用哈萨克语基本名词短语的词性标记信息及构形附加成分信息,建立了基本名词短语规则集,设计了哈萨克语基本名词短语自动识别系统,实现了对30万词级哈萨克语语料库的基本名词短语标注。实验结果表明,该方法可行,识别精确率达到80.8%。 The aims at the identification of Kazakh basic noun phrase,using the method based on the rules and Kazakh basic noun phrase part-of-speech tag information and the additional component configuration information ,starting from the basic noun phrase structure grammar model,established a basic noun phrase rule set,designed automatic identification system of Kazakh which could complete tagging the basic noun phrase of 300 000 words corpus Kazakh. Experimental results show that the method is feasible,and the precision is 80. 8%.
出处 《计算机应用研究》 CSCD 北大核心 2010年第12期4511-4513,4516,共4页 Application Research of Computers
基金 国家自然科学基金资助项目(60763005 61063025 60763005) 国家教育部 国家语委民族语言文字规范标准建设及信息化科研项目(MZ115-92)
关键词 语料库 基本名词短语 哈萨克语 短语结构 规则 corpus basic noun phrase Kazakh phrase structure rules
  • 相关文献

参考文献9

二级参考文献37

  • 1张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量:65
  • 2刘伟权,王明会,钟义信.建立现代汉语依存关系的层次体系[J].中文信息学报,1996,10(2):32-46. 被引量:16
  • 3杨国亮,王志良,刘冀伟,陈锋军,王国江.一种改进的HMM训练算法及其在面部表情识别中的应用[J].计算机科学,2006,33(11):200-204. 被引量:1
  • 4周强.汉语语料库的短语自动划分和标注研究.北京大学博士研究生学位论文[M].-,1996..
  • 5赵军.汉语基本名词短语识别及结构分析研究.清华大学工学博士学位论文[M].-,1998..
  • 6孙宏林.现代汉语非受限文本的实语块分析.北京大学博士研究生学位论文[M].-,2001..
  • 7Church K W. A stochastic parts program and noun phrase parser for unrestricted text[C]//Proceedings of the 2nd Conference on Applied Natural Language Processing. Texas, USA, 1988: 136- 143.
  • 8Brill E. Transform - based Error - driven Learning and Natural Language Processing: A Case Study in Part-of-Speech Tagging [J]. Computational Linguistics, 1995,21 (4) : 543-565.
  • 9Cardie C, Pierce D. Error-driven pruning of the treebank grammars for base noun phrase identification[A]//Proceedings of the 36th International Conference on Computational Linguistics [C]. Montreal, Canada, 1998 : 218-224.
  • 10Xun Endong. A unified statistical model for the identification of English BaseNP[A]//Proceedings of the 38th Annual Meeting of the Association for Computational Linguistics[C]. 2000:104- 111.

共引文献96

同被引文献37

  • 1姜柄圭,张秦龙,谌贻荣,常宝宝.面向机器辅助翻译的汉语语块自动抽取研究[J].中文信息学报,2007,21(1):9-16. 被引量:12
  • 2周强.汉语基本块描述体系[J].中文信息学报,2007,21(3):21-27. 被引量:25
  • 3徐中一,胡谦,刘磊.基于CRF的中文组块分析[J].吉林大学学报(理学版),2007,45(3):416-420. 被引量:7
  • 4王锦,陈群秀.现代汉语语义资源用于短语歧义模式消歧研究[J].中文信息学报,2007,21(5):80-86. 被引量:9
  • 5艾山·吾买尔.维吾尔语词法句法分析关键技术的研究[D].乌鲁木齐:新疆大学,2010.
  • 6赵敬敏.歧义分化方法探讨[M].北京:北京语言学院出版社,1994,1:38-50.
  • 7Abney S.Parsing by chunks[M].Dordrecht:Kluwer Academic Publishers,1991:257-278.
  • 8Church K.A stochastic parts program and noun phrase parser for unrestricted text[C]//Proceedings of the 2nd Conference on Applied Natural Language Processing,Texas,USA,1988:136-143.
  • 9Hindle D,Rooth M.Structural ambiguity and lexical relations[J].Computational Linguistics,1993,19(1):102-120.
  • 10Brill E.A rull-based approach to prepositional phrase attachment disambiguation[C]//15th International Conference on Computational Linguistics,Kyoto,1994.

引证文献4

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部