期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
用于文本区域提取的边缘像素聚类方法 被引量:6
1
作者 付慧 刘峡壁 贾云得 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2006年第5期729-734,共6页
根据边缘点的位置和颜色信息采取逐步松弛的聚类方法将图像分割成像素子集,应用文本区域边缘的分布特征提取初始文本区,并进行边界扩展得到完整的文本区域;同时给出了一种文本区域二值化方法,减少了在文本颜色极性未知时的二值图像个数... 根据边缘点的位置和颜色信息采取逐步松弛的聚类方法将图像分割成像素子集,应用文本区域边缘的分布特征提取初始文本区,并进行边界扩展得到完整的文本区域;同时给出了一种文本区域二值化方法,减少了在文本颜色极性未知时的二值图像个数,可提高字符分割等后续处理的计算效率.实验结果表明,该方法对文本区域提取是有效的,提取完整率达99%. 展开更多
关键词 文本区域提取 图像检索 光学字符识别 聚类 图像二值化
下载PDF
中文电子图书系统开发和应用研究 被引量:2
2
作者 张成昱 赵仪 +1 位作者 邹荣 曾婷 《大学图书馆学报》 CSSCI 北大核心 2002年第4期19-23,18,共6页
以清华大学图书馆-超星电子图书系统的开发和应用为基础,讨论中文电子图书系统的研究和开发背景,以及对于基本技术方案的选择,介绍和分析了它的系统结构、运行模式和部分关键技术。
关键词 清华大学图书馆 超导电子图书系统 ocr 全文检索 系统结构 运行模式 关键技术
下载PDF
图像中多语种文本提取的高斯混合建模方法 被引量:2
3
作者 付慧 刘峡壁 贾云得 《计算机研究与发展》 EI CSCD 北大核心 2007年第11期1920-1926,共7页
建立了相邻字符区域的高斯混合模型,用于区分字符与非字符.在此基础上,提出了一种从图像中提取多语种文本的方法.首先对输入图像进行二值化,并执行形态学闭运算,使二值图像中每个字符成为一个单独的连通成分.然后根据各连通成分重心的Vo... 建立了相邻字符区域的高斯混合模型,用于区分字符与非字符.在此基础上,提出了一种从图像中提取多语种文本的方法.首先对输入图像进行二值化,并执行形态学闭运算,使二值图像中每个字符成为一个单独的连通成分.然后根据各连通成分重心的Voronoi区域,形成连通成分之间的邻接关系;最后在贝叶斯框架下,基于相邻字符区域的高斯混合模型计算相应的伪概率,以此为判据将每个连通成分标注为字符或非字符.利用所提出的文本提取方法,进行了复杂中英文文本的提取实验,获得大于97%的准确率和大于80%的召回率,证实了方法的有效性. 展开更多
关键词 高斯混合模型 文本提取 二值图像 多语种 建模方法 Voronoi区域 字符区域 连通成分
下载PDF
《中国近代中文期刊全文数据库——文学专题》项目的实践与思考 被引量:1
4
作者 陆依君 彭梅 《图书馆杂志》 CSSCI 北大核心 2021年第6期96-100,共5页
在《全国报刊索引》最新全文检索数字资源实践成果的基础上,从知识组织、功能提供、服务创新等角度对基于OCR技术的近代文献数字资源服务的建设和发展提出建议,以期发挥文献的最大利用价值,更好地服务广大读者和专业人士。
关键词 ocr 全文检索 近代文献 数字资源
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部