期刊文献+

维吾尔语词切分方法初探 被引量:39

Research on Uighur Word Segmentation
下载PDF
导出
摘要 维语词的词干 -词附加成分切分、音节切分的规律对维吾尔语自然语言处理方面提供更多方便。本文提出了以“词 =词根 +附加成分”结构。维语附加成分种类繁多 ,连接形式各式各样 ,在句子中起着非常重要的作用 ,同时有相当的规律性。本文提出了维语中可能出现的基本语音规律的处理方法 ,如 :语音同化、音节切分、语音和谐规律处理。本文对维文词的词法和语音法结构进行了归纳 ,提出了维语词切分的一些规律和实现方法。以新疆高校学报为语料来测试 ,对规则词准确率达到 95 %。 Root-affix and syllable segmentation of Uighur word bring great facilities in Uighur natural language processing. Affix in Uighur are various, they link between themselves and to a root in different ways. But there are intricate rules in their linkage. In this paper, we propose methods of handling with the basic phonetic features of Uighur words, such as the final vowel change, rules of vowel and consonant harmony, and syllable segmentation. We also summarized the word structures and phonetic structures of Uighur, and proposed some rules of Uighur word segmentation and implementation of this segmentation. According to the implementation of these rules on regular words from scientific publishing in Xinjiang, the accuracy is 95%.
出处 《中文信息学报》 CSCD 北大核心 2004年第6期61-65,共5页 Journal of Chinese Information Processing
基金 国家自然科学基金资助 (6 996 30 0 2 )
关键词 人工智能 自然语言处理 维吾尔语 词干 词附加成分 切分 artificial intelligence natural language processing uighur word segmentation root affix segmentation
  • 相关文献

参考文献1

  • 1Gulila·Adongbieke. The Research of Proofreading for the Uighur Character [A],The 2001 IEEE International Conference on System, Man and Cybernetics (SMC2001)[C], 2001.10.7 - . 10.10, Tucson, Arizona ,U.S.A,P874- 876.

同被引文献328

引证文献39

二级引证文献155

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部