期刊文献+

用于构建维吾尔文语料库的中文件格式转换技术研究 被引量:2

RESEARCH ON FILE FORMAT CONVERSION TECHNOLOGY FOR CONSTRUCTING UYGHUR LANGUAGE CORPUS
下载PDF
导出
摘要 研究在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊、杂志中获得维吾尔语单词,并转换到Windows环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法。实践证明这种方法有助于提高语料库构造中的大量单词收集的效率和质量。 In this paper we mainly study the fast solution for constructing Uighur text corpus.In the process of construction,the Uyghur language words are captured from books and magazines typeset in MS-DOS system and then converted to RTF format in WINDOWS environment.Then we put forward the RTF code generation timers corresponding to Unicode code of Uygur characters and a simple method of dynamic generation of Uyghur RTF files.Practice proves that this kind of method helps the improvement of efficiency and quality of the collection of a great amount of words during the construction of corpus.
出处 《计算机应用与软件》 CSCD 北大核心 2012年第6期14-16,共3页 Computer Applications and Software
基金 国家自然科学基金项目(61063036) 国家自然科学基金委重点项目(61132009) 国家科技部科技支撑计划项目(2009BAH41B00) 国家教育部社科基金项目(10YJA740121) 国家语委科研规划项目(YB115-38) 国家语委"十二五"科研规划项目(YB125-45) 新疆维吾尔自治区社科基金项目(10BXW105)
关键词 文件转换 RTF(Rich TEXT Format) 维吾尔文 File conversion RTF(Rich Text Format) Uyghur language
  • 相关文献

参考文献4

二级参考文献8

共引文献9

同被引文献13

引证文献2

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部