基于ISO/IEC 10646标准的藏文编码转换的设计与实现被引量：2

Design and Implementation of Tibetan Code Conversion Based on ISO/IEC 10646

下载PDF

导出

摘要目前,国内少数民族地区的书报印刷行业大多使用北大方正、华光藏文排版系统。这些软件的编码各异,致使有限的藏文资源无法实现交换和共享,造成这种现象的原因是各种软件编码体系不一致。解决这个问题的根本途径是将各种不同体系的藏文编码转换为符合国际标准的编码。该文以华光Windows藏文字符编码为例,首先对每个藏文字符进行构字分析,然后采用分表分组技术构造出每个字符符合ISO/IEC 10646标准的编码序列,最后采用hash技术优化查询算法,实现非标准的藏文字符编码向标准编码序列转换。 At present, many publishing systems, such as Bei Da Fang Zheng and Hua Guang are widely applied in the printing industry for issuing Tibetan publications in the domestic minority areas. Due to the different coding system in these systems, the valuable electronic resources for Tibetan languages cannot be exchanged and shared. This paper proposes a solution to convert Tibetan code of different system into the international standard. It further realizes such conversion system for Hua Guang windows encoding of Tibetan into the ISO/IEC 10646 encoding, with a designed sub-table＆group strategy in hash.

作者张青黄鹤鸣章登义

机构地区青海师范大学计算机系青海师范大学物理系武汉大学计算机学院

出处《中文信息学报》 CSCD 北大核心 2009年第4期118-123,共6页 Journal of Chinese Information Processing

基金青海省重点科技攻关项目(2006-N-176)

关键词计算机应用中文信息处理藏文字符集标准编码转换分表分组技术 computer application Chinese information processing Tibetan character encoding standard code conversion encoding sort query

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1International Standard ISO/IEC 10646-1 Second Edition:Information technology-Universal Multiple-Octet Coded Character Set(UCS)[R].2000.
2欧珠.在通用字符集中藏文编码模式的研究与应用[J].中文信息学报,2008,22(4):105-108. 被引量：2
3芮建武,吴健,孙玉芳.基于ISO/IEC10646标准的藏文操作系统若干问题研究[J].中文信息学报,2005,19(5):59-66. 被引量：10
4契嘎·德熙嘉措,当周才让.基于信息处理的藏文字的结构[C]//民族语言文字信息技术研究--第十一届全国民族语言信息学术讨论会论文集,北京:西苑出版社.2007:164-173.
5江荻,周季文.论藏文的序性及排序方法[J].中文信息学报,2000,14(1):56-64. 被引量：32
6尚展垒,陈慧,宋宇伟.一种改进的查询优化技术———分裂大表[J].郑州轻工业学院学报（自然科学版）,2002,17(3):61-63. 被引量：7
7阿里甫.库尔班,哈力木拉提.买买提.北大方正维吾尔文文本转换成Unicode标准的文本[J].新疆大学学报（自然科学版）,2006,23(3):343-347. 被引量：6
8刘汇丹,芮建武,吴健.藏文网页的编码识别与转换[C]∥中文信息处理前沿进展--中国中文信息学会二十五周年学术会议论文集,2006.
9刘涛,杨秀霞.中国多民族文字信息处理中的Unicode编程[J].计算机工程与设计,2006,27(11):2020-2023. 被引量：12

二级参考文献23

1高定国,龚育昌.现代藏字全集的属性统计研究[J].中文信息学报,2005,19(1):71-75. 被引量：32
2芮建武,吴健,孙玉芳.基于ISO/IEC10646标准的藏文操作系统若干问题研究[J].中文信息学报,2005,19(5):59-66. 被引量：10
3[1]中国国家标准.信息技术信息交换用藏文编码字符集基本集(GB6959).北京:中国标准出版社,1997
4[2]张怡荪.藏汉大词典.北京:民族出版社,1985
5[3]周季文.藏文拼音教材.北京:民族出版社,1983
6信息交换用维吾尔文、哈萨克文、柯尔克孜文编码字符集、基本集于扩充集(DB65／2190)-2005
7国家质量技术监督局.GB 16959-1997信息技术-信息交换用藏文编码字符集-基本集[M].中国标准出版社,1998年5月..
8国家质量技术监督局.GB/T16960.1-1997信息技术-藏文编码字符集(基本集)24X48点阵字型-第1部分:白体[M].中国标准出版社,1998年4月..
9国家质量技术监督局.GB/T 17543-1998信息技术-藏文编码字符集(基本集)键盘字母数字区的布局[M].中国标准出版社,1999年6月..
10Joan Aliprand, Julie Allen, Joe Becker, Mark Davis, Michael Everson, Asmus Freytag, John Jenkins, Mike Ksar,Rick McGowan, Eric Muller, Lisa Moore, Michel Suignard, and Ken Whistler. The Unicode Standard Version 4.0[M]. Addison-Wesley, Aug 2003.

共引文献63

1尹蔚彬,戚路堯.周季文藏学研究探析[J].西藏民族大学学报（哲学社会科学版）,2023,44(6):27-32.
2尼玛扎西,李志蜀,群诺,普顿,拥措,陈安龙.一种在移动电话上实现藏文处理的方法[J].四川大学学报（工程科学版）,2009,41(1):162-167. 被引量：9
3林河水,程伟,曹晖,李文波,吴健,孙玉芳.一种符合ISO14651语义的藏文排序实现方法[J].中文信息学报,2004,18(5):36-41. 被引量：19
4何源,戴小鹏,张林峰.数据查询优化算法综述[J].计算机与现代化,2005(4):14-17. 被引量：14
5谢谦,吴健,孙玉芳.X Window核心系统的民文支持[J].中文信息学报,2005,19(4):97-104. 被引量：6
6芮建武,吴健,孙玉芳.基于ISO/IEC10646标准的藏文操作系统若干问题研究[J].中文信息学报,2005,19(5):59-66. 被引量：10
7程伟,林河水,吴健,孙玉芳.数据库管理系统多民族语言支持研究[J].中文信息学报,2006,20(2):94-100. 被引量：4
8贾彦民,吴健,欧珠,孙玉芳.藏文支持在OpenOffice.org办公套件中的实现[J].中文信息学报,2006,20(3):49-54.
9齐贤红,李爱平,贾焰,徐志英,杜娟.一种基于聚簇和分表技术的查询统计优化方法的设计与实现[J].计算机应用研究,2006,23(7):32-34. 被引量：1
10罗进军.当前计算语言学研究的发展态势[J].湖南工业职业技术学院学报,2006,6(4):105-107.

同被引文献15

1祁坤钰.《机器翻译用现代藏语语义词典》的设计研究[J].西北民族大学学报（自然科学版）,2004,25(3):33-37. 被引量：8
2才藏太,华关加.班智达汉藏公文翻译系统中基于二分法的句法分析方法研究[J].中文信息学报,2005,19(6):7-12. 被引量：10
3看卓才旦,金为勋,李延福,洛智华,朋毛扎西.汉藏翻译系统中的动词处理研究[J].术语标准化与信息技术,2006(3):28-32. 被引量：5
4马希荣.夏汉字处理及电子字典[M/CD].北京:清华大学出版社,1999.
5TheTangutUCSEncodingProject.西夏文和统一码[J/OL].2006-07-12[2007-09-01].http://unicode.org/rscook/Xixia/.
6史金波,魏同贤,克恰诺夫.俄藏黑水城文献[M].上海:上海古籍出版社,1997～1999.
7Peter F.Brown,John Cocke,Stephen A.Del a Pietra. A Statical Approach To Machine Translation[J].Computational Linguistics,1990.
8柴春光;宗成庆.影响统计机器翻译系统性能的因素分析[A],2006.
9张大鲲;张玮;董静.基于非连续短语的统计翻译模型[A],2006.
10何中军;刘群;林守勋.统计机器翻译中短语切分的新方法[A],2006.

引证文献2

1柳长青.在线夏汉电子字典的设计与实现[J].宁夏大学学报（自然科学版）,2011,32(4):349-352. 被引量：1
2董晓芳,曹晖,江涛.基于短语的藏汉统计机器翻译系统[J].科技风,2012(17):60-61. 被引量：6

二级引证文献7

1杨洋.中英文翻译软件的开发与应用[J].电子测试,2014,25(4):36-38. 被引量：1
2万福成,于洪志,吴玺宏,何向真.面向机器翻译的藏语短语句法研究[J].计算机工程与应用,2015,51(13):211-215. 被引量：5
3何向真,万福成,于洪志,吴玺宏.基于藏语语义分析的机器翻译技术研究[J].计算机工程与应用,2015,51(15):134-137. 被引量：4
4李小璐,柳长青.我国少数民族文信息化概述[J].电脑知识与技术,2017,13(7X):210-212.
5张瑜.基于移动云计算技术下的汉英翻译系统设计研究[J].现代科学仪器,2020(2):53-56. 被引量：1
6高翊,胡泽林,李淼.汉民双语智能化农业专家系统开发平台与关键技术研究[J].电子技术与软件工程,2022(17):221-225.
7仁青卓玛.藏汉神经机器翻译研究综述[J].西藏科技,2024,46(2):76-80.

1芮建武,吴健,孙玉芳.基于ISO/IEC10646标准的藏文操作系统若干问题研究[J].中文信息学报,2005,19(5):59-66. 被引量：10
2郭辉.完全禁用Windows Me中的系统还原[J].电脑爱好者,2001(13):32-32.
3宋磊,尹俊平,陈虹.基于R的并行统计计算[J].计算机科学,2013,40(3):95-99. 被引量：2
4吴健,孙玉芳,李国华,李祥凯.“炎黄”中文平台结构设计[J].中文信息学报,2001,15(4):53-58. 被引量：3
5谢克中,田霞.BS大字符集编辑输入系统的设计与实现[J].洛阳工学院学报,1996,17(2):65-69.
6李文峰,吴健,孙玉方.基于ISO10646的开放系统的设计与实现[J].计算机学报,1995,18(10):744-754. 被引量：2
7软件医疗站[J].软件指南,2006(7):78-79.
8高文涛.国内外信息安全管理体系研究[J].计算机安全,2008(12):95-97. 被引量：11
9何正安,王欣,代红.藏文软件标准符合性检测的研究与设计[J].信息技术与标准化,2007(8):16-19. 被引量：1
10单艳,蔡李,董军,李晓.维哈柯文字库标准符合性检测研究[J].计算机工程与设计,2012,33(2):766-771.

中文信息学报

2009年第4期

浏览历史

内容加载中请稍等...

基于ISO/IEC 10646标准的藏文编码转换的设计与实现被引量：2

参考文献9

二级参考文献23

共引文献63

同被引文献15

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于ISO/IEC 10646标准的藏文编码转换的设计与实现 被引量：2

参考文献9

二级参考文献23

共引文献63

同被引文献15

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于ISO/IEC 10646标准的藏文编码转换的设计与实现被引量：2