期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于LDP算法的手写数字串切分 被引量:13
1
作者 刘刚 魏锋 +2 位作者 吴铭 张洪刚 郭军 《北京邮电大学学报》 EI CAS CSCD 北大核心 2003年第1期14-18,共5页
以银行票据OCR系统中的账号为例,分析了手写数字串切分的难点,提出了基于LDP算法的切分方法,并对切分过程中的搜索空间、搜索方法及代价函数进行了研究.实际应用表明,采用本方法处理手写数字串倾斜、拥挤和连笔的情况,能够取得良好效果.
关键词 动态规划 受限动态规划 手写数字串切分 图像分割 LDP算法
下载PDF
基于模具的手写数字串切分算法及其应用 被引量:5
2
作者 张洪刚 吴铭 +1 位作者 刘刚 郭军 《计算机学报》 EI CSCD 北大核心 2003年第7期819-824,共6页
提出了一种基于模具的手写数字串切分算法 ,该算法通过总结手写数字串中字符之间的连接特点 ,归纳出一套合理的切分曲线类型 ,并根据这些曲线类型设计出多种切分模具 ,从而将字符的切分过程变为各种模具的试用和优选过程 .通过在银行票... 提出了一种基于模具的手写数字串切分算法 ,该算法通过总结手写数字串中字符之间的连接特点 ,归纳出一套合理的切分曲线类型 ,并根据这些曲线类型设计出多种切分模具 ,从而将字符的切分过程变为各种模具的试用和优选过程 .通过在银行票据OCR系统中的应用 。 展开更多
关键词 手写数字串切分算法 OCR 字符识别 字符切分 数学表达式
下载PDF
基于字串切分统计词典的繁体中文拼写检错方法
3
作者 王勇 顾磊 《计算机应用研究》 CSCD 北大核心 2016年第5期1370-1373,1378,共5页
针对繁体中文拼写检错的问题进行了研究,提出一种基于字串切分统计词典的检错方法。利用语料库中字串出现的频率信息作为检错依据,根据字串及其频率信息来建立统计词典,并设计了基于统计规则评判的检错算法。以SIGHAN7会议中文拼写校验... 针对繁体中文拼写检错的问题进行了研究,提出一种基于字串切分统计词典的检错方法。利用语料库中字串出现的频率信息作为检错依据,根据字串及其频率信息来建立统计词典,并设计了基于统计规则评判的检错算法。以SIGHAN7会议中文拼写校验任务中用于检错评测的1 000句测试集作为实验测试集,并与此会议提交的结果进行比较,实验结果表明,与基于复杂语言模型的检错方法相比,该方法在实现简单的同时也有很好的检错效果,获得了较高的准确率和精确率以及较低的误报率。 展开更多
关键词 中文语言处理 繁体中文拼写检错 中文分词 字串切分 统计词典 混淆集
下载PDF
中文高频词串的抽取及其在语言模型中的应用 被引量:2
4
作者 文娟 王小捷 《北京邮电大学学报》 EI CAS CSCD 北大核心 2009年第5期10-14,共5页
为准确抽取语料库中的高频词串,使其能更好地应用于语言模型中,提出了一种基于字串切分度的中文高频词串(CFS)抽取算法,并用该算法抽取出的CFS分别建立一元和二元语言模型.实验表明,基于CFS的语言模型能有效克服现有基于字和词的n元语... 为准确抽取语料库中的高频词串,使其能更好地应用于语言模型中,提出了一种基于字串切分度的中文高频词串(CFS)抽取算法,并用该算法抽取出的CFS分别建立一元和二元语言模型.实验表明,基于CFS的语言模型能有效克服现有基于字和词的n元语法模型长距离相依性能较差的缺陷;同时,在模型困惑度、音字转换正确率上均优于已有基于净频次的CFS语言模型. 展开更多
关键词 中文高频词串 字区分度 字串切分 N元模型 音字转换
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部