-
题名基于基本图像特征的中朝文种辨识方法
- 1
-
-
作者
张鹏
崔荣一
-
机构
延边大学工学院计算机科学与技术学科智能信息处理研究室
-
出处
《延边大学学报(自然科学版)》
CAS
2017年第2期173-178,共6页
-
基金
吉林省自然科学基金资助项目(20140101186JC)
国家语委科研立项基金资助项目(YB125-178)
-
文摘
提出了一种基于基本图像特征、适用于不同分辨率自然文本图像的中朝文种辨识方法.在训练阶段,首先构造标准文字图像库,然后提取文字的形态学骨架,最后利用骨架的基本图像特征来训练BP神经网络;在辨识阶段,首先对自然文本图像进行倾斜校正后做二值化处理以提高字符分割的效果,然后进行垂直投影、水平投影、字符分割和提取每个字符的骨架信息,最后基于字符骨架的基本图像特征利用BP神经网络来进行文种辨识.实验表明,本文提出的方法在中朝文种辨识中综合辨识准确率可达到87%.
-
关键词
文种辨识
形态学骨架
基本图像特征
BP神经网络
-
Keywords
script identification
morphological skeleton
basic image features
BP neural network
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名多语种文本图像中的文字语种辨识方法的研究
被引量:3
- 2
-
-
作者
朴明姬
崔荣一
-
机构
延边大学计算机科学与技术学院智能信息处理研究室
-
出处
《中文信息学报》
CSCD
北大核心
2017年第2期220-225,共6页
-
基金
吉林省科技发展计划项目(20140101186JC)
国家语委2015年度科研立项项目(教语信司函[2015]21号)
-
文摘
本文针对汉字、朝鲜文字和英文单词混合的文本图像提出了基于主成分分析技术以文字为单位进行文种辨识的方法。首先,通过主成分分析方法构造特征空间,并且把分割的文字映射到此空间得到重构图像;其次,计算原图像和重构图像的水平和垂直方向直方图的相对熵;最后,根据原图像和重构图像之间的欧式距离和相对熵来判别文字语种。实验表明,本文提出的方法在没有分割错误的情况下,能获得99.78%的识别准确率,有效地解决了在汉、朝、英三种文字混合构成的文档图像中文种辨识问题。
-
关键词
文种辨识
主成分分析
相对熵
欧式距离
文字分割
-
Keywords
script identification
principal component analysis
relative entropy
Euclidean distance
character segmentation
-
分类号
TP
[自动化与计算机技术]
-