期刊文献+

用于构建维吾尔文语料库的中文件格式转换技术研究

Research of Construction of the Uyghur Language Corpus File Format Conversion Technology
下载PDF
导出
摘要 文章研究的是在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊,杂志中获得维吾尔语单词,并转换到WINDOWS环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法。实践证明这种方法有助于提高语料库构造中的大单词收集的效率和质量。 This paper mainly studies the RTF files through the analysis of the structure, is a rapid so lutions that in the process of building the Uighur text corpus, from former ms--dos system of the publish- ing hooks, magazines gain in the Uyghur language words and convert to WINDOWS environment on RTF format. And then put forward the corresponding Unicode characters Uygur RTF code generation timers and dynamic generation Uyghur, RTF files of simple method. The practice proves that this kind of method to solve the corpus of the structure of collected words hitch efficiency, high rate of accuracy.
出处 《新疆师范大学学报(自然科学版)》 2012年第3期11-15,共5页 Journal of Xinjiang Normal University(Natural Sciences Edition)
基金 新疆维吾尔自治区社科基金(批准号:10BXW105) 国家科技部科技支撑计划项目(2009BAH41B00) 国家自然科学基金项目(批准号:61063036) 国家教育部社科基金(10YJA740121) 国家语委科研规划项目(YB115-38) 国家自然科学基金委重点项目(批准号:61132009) 国家语委"十二五"科研规划项目(YB125-45)等项目的支持
关键词 文件转换 RTF(Reich TEXT Format) 维吾尔文 File conversion RTF(Reich Text Format) Uyghur language
  • 相关文献

参考文献4

二级参考文献8

共引文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部