期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
多文种环境下汉字内码识别算法的研究 被引量:16
1
作者 李培峰 朱巧明 钱培德 《中文信息学报》 CSCD 北大核心 2004年第2期73-79,共7页
汉字内码向ISO/IEC 10 6 46过渡是实现计算机用文字编码统一的必然趋势 ,但目前在一段时间内仍将存在多种汉字内码并存的情况 ,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中... 汉字内码向ISO/IEC 10 6 46过渡是实现计算机用文字编码统一的必然趋势 ,但目前在一段时间内仍将存在多种汉字内码并存的情况 ,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中实现汉字内码自动识别的问题 ,并提供了多种汉字内码识别算法 ,包括基于内码分布、标点符号特征、字频特征和语义特征的识别算法等。在此基础上 ,本文对不同的识别算法进行分析和评估。在对目标样本的测试中 ,以上算法的识别率最高可以达到 99 9%以上。 展开更多
关键词 计算机应用 中文信息处理 多文种环境 汉字内码 识别算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部