期刊文献+

藏文组字部件的自动识别与字排序研究

Research on the Automatic Recognition and Sorting of Tibetan Word Components on the Unicode
下载PDF
导出
摘要 藏文字有着独特的构字规则,组字部件的自动识别在藏文字、词、句层面的信息化处理有重要的应用。文章提出的藏文字部件自动识别方法理念为,现代藏文字按其第一个部件字符的不同分成5种结构类型,每一种类型又按其字长分为若干个子类,在每个子类中定义各字的部件识别算法,最后在藏文组字部件识别的基础上,给每个部件赋予序值,实现藏文字的有效排序。 Tibetan words have unique structure rules.The automatic recognition and sorting of word componentshas an important application in the information processing of various Tibetan word components such as charac-ter,word and sentence-level on the Unicode.In the present paper,according to the first component of Tibetancharacter,the Tibetan word structure can be divided into 5 categories.Each of word structure has been dividedinto several subcategories by the length of words.A recognition algorithm was defined for each word componentsin each subcategory.The ordinal value was given to each component of character based on the word componentrecognition to realizes sorting of Tibetan word efficiently.
作者 才华
出处 《西藏大学学报(社会科学版)》 CSSCI 2014年第5期81-86,101,共7页 Journal of Tibet University
基金 2013年度西藏大学青年科研培育基金项目"Unicode藏文分词相关技术研究"阶段性成果 项目号:ZD-PJZK201314
关键词 藏文信息处理 构字部件 字符序值 字排序 Tibetan information processing Tibetan word component ordinal value of character word sorting
  • 相关文献

参考文献5

二级参考文献19

  • 1格桑居冕.藏文字性法与古藏语音系[J].民族语文,1991(6):12-22. 被引量:8
  • 2江荻,董颖红.藏字叠加结构线性处理统计分析[J].中文信息,1994,11(4):44-46. 被引量:11
  • 3江荻,董颖红.藏文信息处理属性统计研究[J].中文信息学报,1995,9(2):37-44. 被引量:19
  • 4道布.中国少数民族文字[M].北京:中国藏学出版社,1991..
  • 5于洪志.藏文编码字符集国家标准的讨论.国际第三届中文多文种信息处理学术交流会论文集[M].北京,1992,10..
  • 6于洪志.藏文中字符集编码的可行性.第六届少数民族文字信息处理全国学术交流会论文集[M].南宁,1995,5..
  • 7于洪志.藏文信息处理的问题与对策.中国中文信息学会汉字编码专业委员会第七届年会暨学术交流会论文集[M].,1996..
  • 8National Standard of PRC. Information Technology, Tibeyan Coded Character Sets for Information Interchange, Basic Set(GB 16959-1997). Beijing: Standards Press of China, 1998(in Chinese)(中华人民共和国国家标准. 信息技术、信息交换用藏文编码字符集、基本集(GB16959-1997). 北京:中国标准出版社,1998)
  • 9ISO/IEC 10646-1:1993:Information Technology-Universal Multiple-Octet Coded Character(UCS)
  • 10于洪志.计算机藏文编码性能指标分析[J].西北民族学院学报(自然科学版),1997,18(2):15-20. 被引量:4

共引文献59

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部