期刊文献+

多编码环境下藏字内码识别算法的研究 被引量:2

Research of Tibetan Character Internal Codes Recognition Algorithm in the Multi-coded Environment
下载PDF
导出
摘要 藏字内码向ISO/IEC 10646-1藏文编码过渡是实现计算机用文字编码统一的必然趋势,但目前在很长的一段时间内仍将存在多种藏字编码并存的情况,所以实现藏字内码的自动识别是保证藏字多内码并存的关键。主要探讨了如何在多内码并存的多编码环境中实现藏字内码自动识别的问题,并提供了两个藏字内码识别算法。在此基础上,对不同的识别算法进行分析和评估。在对目标样本的测试中,以上算法的识别率最高可以达到100%以上。 It s a general tendency that the tibetan Character Internal Codes used in computer should transfer to ISO/IEC 10646-1,but there are multi-tibetan Character Internal Codes used in the computer now,and this instance will stand a long time.So how to realize the tibetan Character Internal Codes auto recognition is the key to build a Multi-coded Environment.This paper mainly discusses the tibetan Character Internal Codes recognition algorithms in the Multilingual Environment,and provides two recognition algorithms, such as Internal Code Bound Recognition Algorithm, Interpunction Recognition Algorithm, tibetan Character Frequency Recognition Algorithm and Semantic Recognition Algorithm. This paper also evaluates the algorithms mentioned in this paper, and the rate of Recognition can reach 100% used these recognition algorithms on the test documents.
作者 安见才让
出处 《微处理机》 2009年第5期69-71,共3页 Microprocessors
关键词 计算机应用 藏文信息处理 多编码环境 藏字内码 识别算法 Computer application Tibtan information processing Multi-coded environment Tibetan character internal code Recognition algorith
  • 相关文献

参考文献3

二级参考文献10

  • 1于洪志.藏文编码字符集国家标准的讨论.国际第三届中文多文种信息处理学术交流会论文集[M].北京,1992,10..
  • 2于洪志.藏文中字符集编码的可行性.第六届少数民族文字信息处理全国学术交流会论文集[M].南宁,1995,5..
  • 3于洪志.藏文信息处理的问题与对策.中国中文信息学会汉字编码专业委员会第七届年会暨学术交流会论文集[M].,1996..
  • 4香港增补字符集:http://www.digital21.gov.hk/chi/hkscs/introduction.html.
  • 5CJK 有关信息:ftp://ftp.ora.com/pub/examples/nutshell/ujip/doc/cjk.inf.
  • 6藏文编码http://www.tibetaninfo.net/lyz/wl/zwxxjs.ht.
  • 7The Unicode Consortium:http://www.Unicode.org.
  • 8International Standard ISO/IEC 10646-1 Second Edition:Information technology-Universal Multiple-Octet Coded Character Set(UCS),2000.
  • 9于洪志.计算机藏文编码性能指标分析[J].西北民族学院学报(自然科学版),1997,18(2):15-20. 被引量:4
  • 10于洪志.全藏文编码体系[J].西北民族大学学报(自然科学版),1998,23(1):5-10. 被引量:4

共引文献13

同被引文献17

引证文献2

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部