-
题名结合文字核心区域和扩展生长的藏文古籍文本行切分
被引量:4
- 1
-
-
作者
李金成
王筱娟
王维兰
林强
胡鹏飞
-
机构
西北民族大学中国民族语言文字信息技术教育部重点实验室
西北民族大学数学与计算机科学学院
-
出处
《激光与光电子学进展》
CSCD
北大核心
2021年第2期105-115,共11页
-
基金
国家自然科学基金(61772430)
国家民委创新团队计划(〔2018〕98号)
+2 种基金
甘肃省双一流学科建设项目(11080304)
甘肃省高等学校创新能力提升项目(2019B-024)
西北民族大学中央高校基本科研业务费项目(31920180050)。
-
文摘
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。
-
关键词
图像处理
藏文古籍文档图像
文本行切分
文字核心区域
扩展生长
-
Keywords
image processing
Tibetan historical document image
text line segmentation
text core region
expansion growth
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名文本行字符基线的精确测定算法
被引量:2
- 2
-
-
作者
卢达
浦炜
谢铭培
-
机构
常熟高等专科学校
上海复旦大学计算机科学系
-
出处
《小型微型计算机系统》
EI
CSCD
北大核心
2000年第7期726-728,共3页
-
基金
国家自然科学基金
江苏省教委留学回国人员科研基金资助
-
文摘
本文给出了精确测定文本行字符基线的算法 ,讨论了基线检测的容差 .该算法也可用于手写字符的分析 .实验结果表明 ,我们的基线检测算法对不同大小的字符有满意的处理结果 .
-
关键词
字符识别
文本行切分
基线检测
文本处理
-
Keywords
Character recognition
Text line segmentation
Character segmentation
Baseline detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名文本行字符基线的精确测定算法
- 3
-
-
作者
卢达
浦炜
-
机构
常熟高等专科学校
-
出处
《中山大学学报论丛》
1999年第4期12-16,共5页
-
基金
江苏省教委留学回国人员科研基金
-
文摘
给出了精确测定文本行字符基线的算法, 讨论了基线检测的容差。该算法也可用于手写字符的分析。实验结果表明, 该基线检测算法对不同大小的字符都有满意的处理结果。
-
关键词
字符识别
文本行切分
字符切分
基线检测
-
分类号
G64
[文化科学—高等教育学]
-
-
题名基于多重规则和路径评价的在线中英文手写识别方法
被引量:1
- 4
-
-
作者
付鹏斌
刘鹏辉
杨惠荣
董澳静
-
机构
北京工业大学信息学部
-
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第3期253-262,共10页
-
基金
国家自然科学基金(61772048)
北京市自然科学基金(4153058)。
-
文摘
手写文本识别方法主要应用于文本输入技术,对人机交互领域的发展起关键作用。针对多数在线输入法无法识别中英文混合手写识别的问题,提出一种在线中英文混合手写文本识别方法。通过对文本笔画进行基于水平相对位置、垂直重叠率、面积重叠率规则的整合以及连笔切分,得到一系列字符片段,同时利用笔画个数、宽高比、中心偏离、平滑度等几何特征和识别置信度,对字符片段进行中英文分类。在此基础上,根据分类结果并结合自然语言模型的路径评价及动态规划搜索算法,分别对候选的中、英文字符片段进行合并处理,得到待识别的中、英文字符序列,并将其分别送入卷积神经网络的中、英文识别模型中,得到手写文本识别结果。实验结果表明,在线手写中英文混合文本识别正确率达93.67%,不仅能切分在线手写中文文本行,而且对包含字符连笔的在线手写中英文文本行也有较好的切分效果。
-
关键词
在线手写识别
中英文混合手写
中英文分类
文本行切分
路径评价
-
Keywords
online handwriting recognition
mixed Chinese and English handwriting
Chinese and English classification
text line segmentation
path evaluation
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-