摘要
藏文虚词的研究是藏文信息处理技术中词、句及语义研究的基础,而计算机自动识别藏文虚词又是藏语虚词研究的前提。该文在论述藏语虚词在藏语文本中的作用和使用方法的基础上,分析了计算机识别藏语虚词的难度,提出了一个计算机识别藏语虚词的方法,并用2 525句典型藏文句子进行了验证,对结果进行分析发现藏文虚词识别的正确率高达97.076 8%。
Research on the Tibetan function word is essential to the research on words, sentences and semantics in the Tibetan information processing. The automatic idetification of Tibetan function word paves the way for further research on the Tibetan function word. This paper discusses the role and use of Tibetan function words, reveals the difficulties in automatic identification of Tibetan function word, and finaly proposes a method for the automatic iden- tification of Tibetan function word. The experiment on 2 525 sentences achieves an accuracy of 97. 076 8% for this method.
出处
《中文信息学报》
CSCD
北大核心
2014年第1期113-117,共5页
Journal of Chinese Information Processing
基金
国家自然科学基金(61063015
61163043
61165010)
教育部人文社科基金(10YJCZH033)
国家语委项目(MZ115-039)
2011年度西藏自治区科技计划项目"基于语料库的藏语词汇计量研究"
关键词
识别
藏语
虚词
indentification, Tibetan, function word