期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向OCR文本识别词错误自动校对方法研究
被引量:
12
1
作者
郝亚男
乔钢柱
谭瑛
《计算机仿真》
北大核心
2020年第9期333-337,共5页
针对OCR识别后文本中词错误校对问题,提出一种同一特征多角度结合的OCR识别后文本中词错误的自动校对方法。方法通过上下文相邻词与窗口移动法相结合为句子中字词串计算置信度,设计置信度计算方法判断正误,给出疑似错误位置;利用统计语...
针对OCR识别后文本中词错误校对问题,提出一种同一特征多角度结合的OCR识别后文本中词错误的自动校对方法。方法通过上下文相邻词与窗口移动法相结合为句子中字词串计算置信度,设计置信度计算方法判断正误,给出疑似错误位置;利用统计语言模型与同一特征多角度相结合的方式对错误处提出改进建议。采用检察院纸质卷宗OCR识别后的文本数据进行了测试,实验测试集中共包含236处错误。实验结果表明,所提出的方法能够有效发现文本中错误,查错召回率达到88.56%,纠错的准确率达到79%,上述方法能够有效实现OCR识别后的中文文本自动校对。
展开更多
关键词
窗口移动法
拼写查错
拼写
纠
错
语言模型
下载PDF
职称材料
题名
面向OCR文本识别词错误自动校对方法研究
被引量:
12
1
作者
郝亚男
乔钢柱
谭瑛
机构
太原科技大学计算机科学与技术学院
出处
《计算机仿真》
北大核心
2020年第9期333-337,共5页
基金
山西省重点研发计划重点项目(201703D111011)。
文摘
针对OCR识别后文本中词错误校对问题,提出一种同一特征多角度结合的OCR识别后文本中词错误的自动校对方法。方法通过上下文相邻词与窗口移动法相结合为句子中字词串计算置信度,设计置信度计算方法判断正误,给出疑似错误位置;利用统计语言模型与同一特征多角度相结合的方式对错误处提出改进建议。采用检察院纸质卷宗OCR识别后的文本数据进行了测试,实验测试集中共包含236处错误。实验结果表明,所提出的方法能够有效发现文本中错误,查错召回率达到88.56%,纠错的准确率达到79%,上述方法能够有效实现OCR识别后的中文文本自动校对。
关键词
窗口移动法
拼写查错
拼写
纠
错
语言模型
Keywords
Window movement method
Spelling check
Spelling correction
Language model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向OCR文本识别词错误自动校对方法研究
郝亚男
乔钢柱
谭瑛
《计算机仿真》
北大核心
2020
12
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部