摘要
以哈萨克语基本名词短语识别为目标,采用基于规则的方法,从基本名词短语结构语法模型出发,利用哈萨克语基本名词短语的词性标记信息及构形附加成分信息,建立了基本名词短语规则集,设计了哈萨克语基本名词短语自动识别系统,实现了对30万词级哈萨克语语料库的基本名词短语标注。实验结果表明,该方法可行,识别精确率达到80.8%。
The aims at the identification of Kazakh basic noun phrase,using the method based on the rules and Kazakh basic noun phrase part-of-speech tag information and the additional component configuration information ,starting from the basic noun phrase structure grammar model,established a basic noun phrase rule set,designed automatic identification system of Kazakh which could complete tagging the basic noun phrase of 300 000 words corpus Kazakh. Experimental results show that the method is feasible,and the precision is 80. 8%.
出处
《计算机应用研究》
CSCD
北大核心
2010年第12期4511-4513,4516,共4页
Application Research of Computers
基金
国家自然科学基金资助项目(60763005
61063025
60763005)
国家教育部
国家语委民族语言文字规范标准建设及信息化科研项目(MZ115-92)