期刊文献+

基于功能词缀串的维吾尔语词性标注方法 被引量:8

The Uyghur POS-Tagging Method Based on Functional Suffix Strings
下载PDF
导出
摘要 维吾尔语作为一种典型的黏着语,通过丰富的功能词缀来表达各种语法和语气。该文探讨了"词干词性标注方法"与"词缀词性标注方法"在维吾尔语自然语言处理中的优缺点。在大规模语料库中,统计了常用词缀串的数量、频次和覆盖度,以此来判断词缀词性标注方法在自然语言处理中的可行性。以力提甫·托乎提教授的维吾尔语生成语法理论为指导,对词缀串的词性标注进行了相应的语法定义,并且在实际语料中进行了小规模词性标注实验。该文提出的基于词缀串的词性标注方法不仅适用于维吾尔语,也适用于有着大量相似词缀的突厥语族其他语言。 As a typical agglutinative language,Uyghur have rich suffixes to express syntax and mood.This paper contrast two kinds of POS-Tagging method in Uyghur language processing:one is POS-Tagging based on the stem words,the other is based on the suffixes.We statistics the sum,the frequency,and the cover degree of common functional suffix strings in a big corpus,aim to judge the feasibility of POS-Tagging method based on suffix strings.We define the regulation of suffix POS-Tagging based on the theory of Prof.Litip Tohti and label some corpus based on this kind of POS-Tagging definition,which is not only useful to Uyghur,but also to other Turkic languages which have much similar suffixes.
出处 《中文信息学报》 CSCD 北大核心 2013年第5期179-183,共5页 Journal of Chinese Information Processing
关键词 维吾尔语 词缀串 词性标注 Uyghur suffix strings POS-Tagging
  • 相关文献

参考文献5

二级参考文献25

  • 1周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量:43
  • 2牛洪梅,吐尔根,伊不拉音.维吾尔语的词性标注校对初探[J].微型电脑应用,2006,22(12):45-47. 被引量:1
  • 3哈密提·铁木尔.现代维吾尔语语法[M].北京:民族出版社,1987.
  • 4Chafe Wallace L. Meaning and Structure of Language[M]. Chicago, The University of Chicago Press, 1970, 97.
  • 5哈米提·铁木尔.现代维吾尔语语法·形态学[M].北京:民族出版社,1987.
  • 6刘开瑛 郑家恒 赵军.语料库词类自动标注方法算法研究.机器翻译研究进展,1992,:378-386.
  • 7Leech. Geoffrey Corpus annotation schemes[J]. Literary and Linguistic Computing, 1993, 8(4): 275-469.
  • 8力提甫·托合提.阿尔泰语言的句法结构.中国人民大学出版社,2004.
  • 9俞士汶.计算语言学[M].商务印书馆,2003.
  • 10刘群.自然语言理解[M].电子工业出版社,2005.

共引文献8

同被引文献83

引证文献8

二级引证文献17

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部