摘要
首先对现代维吾尔语词尾或词缀进行描述和定义;其次陈述调查使用的网络媒体语料来源、语料说明、词法结构、词语还原方法、语料应用领域、采集的语料时间跨度与统计方法;最后介绍词尾的使用情况,包括频次超过万次以上的词尾、词尾频次分段分析、词尾长分段分析结果。
In this paper,first we describe and define the suffix and affix of modern Uyghur;Secondly,we state the survey in this regard including the resource of the websites media corpus,the description of the corpus,the morphology structure,the method of term reduction,the application field of the corpus,the time span of the collected corpus,and the statistics approach;Thirdly,we introduce the situation of the usage of the suffix,including those suffixes with the frequency to be used over ten thousands times,the segmentation analysis on suffix frequency and the result of suffix length segmentation analysis.
出处
《计算机应用与软件》
CSCD
北大核心
2012年第4期13-15,共3页
Computer Applications and Software
基金
国家自然科学基金项目(61063036)
国家自然科学基金委重点项目(61132009)
国家语委科研规划项目(YB115-38)
国家教育部社科基金项目(10YJA740121)
国家语委"十二五"科研规划项目(YB125-45)
国家科技部科技支撑计划项目(2009BAH41B00)
关键词
现代维吾尔文
网站
词尾
切分
Modern Uyghur Website Suffix Segmentation