摘要
维吾尔语自动标注是维吾尔语信息处理后续句法分析、语义分析及篇章分析必不可少的基础工作。词性是词的重要的语法信息,假如一个词的词性无法确定或一个词给予错误的词性,对后续句法分析造成直接的影响。本文使用感知器训练算法和viterbi算法对维吾尔语进行词性标注,并在词性标注时利用词的上下文信息作为特征。实验结果表明,该方法对维吾尔语词性标注有良好的效果。
Uyghur POS tagging is essential for subsequent tasks such as Uyghur sentence analysis, semantic analysis and discourse analysis. In this paper, perceptron training algorithm and viterbi algorithm are used for Uyghur POS tagging, and the context information of the words are employed. Experiment results show that this method has good results for the Uyghur POS tagging.
出处
《中文信息学报》
CSCD
北大核心
2014年第5期187-191,共5页
Journal of Chinese Information Processing
关键词
词性标注
感知器算法
维吾尔语词性标注
The speech tagging
Perceptron algorithm
Uyghur speech tagging