摘要
文章研究的是在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊,杂志中获得维吾尔语单词,并转换到WINDOWS环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法。实践证明这种方法有助于提高语料库构造中的大单词收集的效率和质量。
This paper mainly studies the RTF files through the analysis of the structure, is a rapid so lutions that in the process of building the Uighur text corpus, from former ms--dos system of the publish- ing hooks, magazines gain in the Uyghur language words and convert to WINDOWS environment on RTF format. And then put forward the corresponding Unicode characters Uygur RTF code generation timers and dynamic generation Uyghur, RTF files of simple method. The practice proves that this kind of method to solve the corpus of the structure of collected words hitch efficiency, high rate of accuracy.
出处
《新疆师范大学学报(自然科学版)》
2012年第3期11-15,共5页
Journal of Xinjiang Normal University(Natural Sciences Edition)
基金
新疆维吾尔自治区社科基金(批准号:10BXW105)
国家科技部科技支撑计划项目(2009BAH41B00)
国家自然科学基金项目(批准号:61063036)
国家教育部社科基金(10YJA740121)
国家语委科研规划项目(YB115-38)
国家自然科学基金委重点项目(批准号:61132009)
国家语委"十二五"科研规划项目(YB125-45)等项目的支持