期刊文献+

利用上下文相关信息的汉字文本识别 被引量:7

Chinese Text Recognition Using Contextual Information
下载PDF
导出
摘要 为了改善汉字文本识别率,本文提出了一种基于语料库统计概率的后处理方法,该方法利用上下文相关信息,超过词汇。对于汉字文本识别,把具有确定性边界的一个汉字序列(多数情况为一个句子)作为一个处理单元,利用统计获得的字字同现概率,采用动态规划方法,获得了令人满意的效果。 In order to improve Chinese text recognition rate, in this paper we present a post processing method of corpus-based statistical probabilities. The method has used contextual information more than the lexical lever knowledge. For Chinese text recognition, a bounded seguence of Chinese characters (more often, a sentence) is processed as an unit. And the cooccurrence probability between characters and dynamic progamming strategy are employed to acquire the satisficatory recognition results.
出处 《中文信息学报》 CSCD 1996年第1期23-30,共8页 Journal of Chinese Information Processing
关键词 汉字识别 语料库语言学 汉字文本识别 Chinese Characters Recognition, Corpus Linguistics, Markov Model, Post processing
  • 相关文献

参考文献7

  • 1Xia Ying,NLPPR’93,1993年
  • 2常新功,全国智能接口与应用专题会议,1993年
  • 3曲洪亚,第四届全国汉字及汉语语音识别会议论文集,1992年
  • 4张彩录,第四届全国汉字及汉语语音识别会议论文集,1992年
  • 5白栓虎,硕士学位论文,1992年
  • 6Gu Huangyan,Computer Speech Language,1991年,5卷,563页
  • 7崔国伟,模式识别与人工智能,1989年,2卷,1期,3页

同被引文献34

引证文献7

二级引证文献43

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部