用于构建维吾尔文语料库的中文件格式转换技术研究被引量：2

RESEARCH ON FILE FORMAT CONVERSION TECHNOLOGY FOR CONSTRUCTING UYGHUR LANGUAGE CORPUS

下载PDF

导出

摘要研究在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊、杂志中获得维吾尔语单词,并转换到Windows环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法。实践证明这种方法有助于提高语料库构造中的大量单词收集的效率和质量。 In this paper we mainly study the fast solution for constructing Uighur text corpus.In the process of construction,the Uyghur language words are captured from books and magazines typeset in MS-DOS system and then converted to RTF format in WINDOWS environment.Then we put forward the RTF code generation timers corresponding to Unicode code of Uygur characters and a simple method of dynamic generation of Uyghur RTF files.Practice proves that this kind of method helps the improvement of efficiency and quality of the collection of a great amount of words during the construction of corpus.

作者艾斯卡尔.亚克甫艾孜尔古丽玉素甫.艾白都拉

机构地区中国海洋大学信息科学与工程学院新疆维吾尔自治区大中专招生办公室新疆师范大学

出处《计算机应用与软件》 CSCD 北大核心 2012年第6期14-16,共3页 Computer Applications and Software

基金国家自然科学基金项目(61063036) 国家自然科学基金委重点项目(61132009) 国家科技部科技支撑计划项目(2009BAH41B00) 国家教育部社科基金项目(10YJA740121) 国家语委科研规划项目(YB115-38) 国家语委"十二五"科研规划项目(YB125-45) 新疆维吾尔自治区社科基金项目(10BXW105)

关键词文件转换 RTF(Rich TEXT Format) 维吾尔文 File conversion RTF（Rich Text Format） Uyghur language

分类号 TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1Microsoft Corporation (2004 -04 -20). Word 2003: Rich Text Format (RTF) Specification, version 1.8[S/OL]. 2010-03 13. http:// www. microsoft, corn/downloads/details, aspx? familyid = AC57DE32- 17 F04B46-9FAE-467EFgBC5540&displaylang = en.
2蒋悦,吴壮志,赵旭林,怀进鹏.基于文档树的XML文件转换[J].计算机工程,2003,29(21):97-99. 被引量：2
3王宇.RTF文件格式在文档版面重构中的应用[J].计算机应用,2002,22(12):74-75. 被引量：9
4石锋,王一拙.一种快速RTF格式化方法[J].北京理工大学学报,2001,21(1):120-122. 被引量：5

二级参考文献8

1Kruglinski D J 王国印（译）.Visual C++^TM技术内幕[M].北京:清华大学出版社,1994..
2田学东郭宝兰.“识别优先”的印刷文档自动输入技术.ICCC2001[M].新加坡:新加坡国立大学,2001..
3Microsoft Corporation.XML3.0技术内幕[M].北京:清华大学出版社,2001.31-35.
4Chen Yunli，北京理工大学学报，1998年，18卷，6期，689页
5王国印（译），Visual C＋＋TM技术内幕，1994年
6余阳,游燕.RTF文件格式分析及在多媒体中的应用[J].计算机工程,1999,25(4):30-31. 被引量：3
7史长琼,李建华,费耀平.RTF格式在基于Intranet的公文系统中的运用[J].中南工学院学报,1999,13(1):27-33. 被引量：1
8石锋,王一拙.一种快速RTF格式化方法[J].北京理工大学学报,2001,21(1):120-122. 被引量：5

共引文献9

1杨林,刘正光.RTF在中日文数据库软件开发中的应用[J].微处理机,2005,26(5):39-41. 被引量：2
2王秀鸾.Word文档与结构化数据的转换方法研究[J].福建电脑,2006,22(9):161-161.
3桃子.最期待的4款液晶显示器[J].网络与信息,2006,20(11):12-12.
4吕书龙,刘文丽,梁飞豹.RTF在统计软件设计中的应用[J].计算机应用与软件,2011,28(3):113-115.
5马兴录,陈为.嵌入式设备中虚拟打印技术的实现[J].计算机应用,2006,26(S2):292-293. 被引量：3
6陈文峰,刘祚秋.基于C#实现文字图表显示的两种方法[J].计算机应用与软件,2011,28(12):243-245. 被引量：1
7艾斯卡尔.亚克甫,艾孜尔古丽,玉素甫.艾白都拉.用于构建维吾尔文语料库的中文件格式转换技术研究[J].新疆师范大学学报（自然科学版）,2012,31(3):11-15.
8王宇.RTF文件格式在文档版面重构中的应用[J].计算机应用,2002,22(12):74-75. 被引量：9
9赵宏,余冬梅,黄德生.基于WEB技术试题库系统的研究与开发[J].电化教育研究,2003,24(7):40-42. 被引量：2

同被引文献13

1俞士坟.北京大学现代汉语语料库基本加工规范[M].科学出版社,2010,1016(5):49-64.
2袁毓林.语义资源建设的最新趋势和长远目标——通过映射对比、走向统一联合、实现自动推理[J].中文信息学报,2008,22(3):3-15. 被引量：13
3古丽拉.阿东别克,达吾勒.阿布都哈依尔,木合亚提.尼亚孜别克,刘晓洁.现代哈萨克语词级标注语料库的构建研究[J].新疆大学学报（自然科学版）,2009,26(4):394-401. 被引量：7
4余秋冬,纪宁.Office自动判分系统的设计思想与实现[J].南昌大学学报（理科版）,2011,35(3):302-306. 被引量：3
5热西旦木.塔依,吐尔根.依布拉音.汉文-维吾尔文双语对齐语料库构建的实验性研究[J].伊犁师范学院学报（自然科学版）,2008,2(4):33-37. 被引量：3
6木合亚提·尼亚孜别克,古力沙吾利.哈萨克文信息处理现状中的若干问题探讨[J].智能计算机与应用,2011,1(4):45-46. 被引量：4
7邹箭,钟茂生,孟荔.中文文本分割模式获取及其优化方法[J].南昌大学学报（理科版）,2011,35(6):597-601. 被引量：7
8艾孜尔古丽,艾山江.阿不力孜,玉素甫.艾白都拉.现代维吾尔文网络媒体用词研究[J].计算机应用与软件,2012,29(2):67-68. 被引量：7
9艾孜尔古丽,齐向卫,玉素甫.艾白都拉.基于网站用词调查的现代维吾尔语词干提取和应用研究[J].计算机应用与软件,2012,29(3):32-34. 被引量：11
10玉素甫.艾白都拉,艾孜尔古丽.基于网站用词调查的现代维吾尔语词尾切分和应用研究[J].计算机应用与软件,2012,29(4):13-15. 被引量：6

引证文献2

1木合亚提·尼亚孜别克,古力沙吾利·塔里甫,达吾勒·阿布都哈依尔.柯尔克孜语语料库语言资源管理平台的设计与开发[J].南昌大学学报（理科版）,2015,39(3):247-250. 被引量：3
2热西旦·玉素甫.初中数学维吾尔文教材词频统计分析[J].语文学刊（基础教育版）,2014,0(1):37-38. 被引量：1

二级引证文献4

1李德鹏,窦建民.我国语言资源保护与开发利用研究述评(1981～2016)[J].云南师范大学学报（对外汉语教学与研究版）,2017,15(6):44-60. 被引量：5
2吐尔根.依布拉音,卡哈尔江.阿比的热西提,艾山.吾买尔,买合木提.买买提.中亚语言自然语言处理综述[J].中文信息学报,2018,32(5):1-13. 被引量：6
3古力沙吾利.塔里甫,木合亚提.尼亚孜别克.哈萨克医学术语的现状和存在问题的分析[J].中国科技术语,2019,21(1):10-13. 被引量：3
4周迪,周晓聪,候婷.基于统计自然语言分析的九宫格输入法最优键盘布局[J].智能计算机与应用,2021,11(7):202-204. 被引量：1

1付宗洲.MS—DOS系统下多任务的实现方法[J].电子与自动化,1996,25(2):49-51.
2王甲春.千找万寻虽辛苦帮助文件帮你忙[J].家庭电脑世界,2000(10):48-50.
3阿亮.利用RTF文件实现Word与WPS文件互相转换[J].电脑知识与技术（过刊）,2004(7):30-30.
4天龙.QQ酷技巧三则[J].软件指南,2003(4):35-36.
5应用软件[J].电子与金系列工程信息,2002(12):54-55.
6小白.两招搞定word文档中的乱码[J].网络与信息,2006,20(3):75-75.
7抢救、还原WORD文件一法[J].计算机与网络,2003(18):61-61.
8李顺宝.RTF格式文件的自动阅卷系统研究[J].计算机与现代化,2001(4):122-126. 被引量：3
9史长琼,李建华,费耀平.RTF格式在基于Intranet的公文系统中的运用[J].中南工学院学报,1999,13(1):27-33. 被引量：1
10邱立铭,王键.RTF文件结构分析及其应用[J].电子与电脑,1998,5(8):93-94.

计算机应用与软件

2012年第6期

浏览历史

内容加载中请稍等...

用于构建维吾尔文语料库的中文件格式转换技术研究被引量：2

参考文献4

二级参考文献8

共引文献9

同被引文献13

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

用于构建维吾尔文语料库的中文件格式转换技术研究 被引量：2

参考文献4

二级参考文献8

共引文献9

同被引文献13

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

用于构建维吾尔文语料库的中文件格式转换技术研究被引量：2