题名 一种离线手写体汉字切分的自适应算法
被引量:2
1
作者
朱锴
赵宇明
吴越
机构
上海交通大学图象处理与模式识别研究所
出处
《计算机工程与应用》
CSCD
北大核心
2004年第6期47-50,共4页
基金
国家自然科学基金资助项目(编号:60075007)
文摘
目前用于字符切分的算法主要有基于灰度直方图投影、字符连通域算法等,但这些算法不适用于相邻粘连汉字的切分。论文针对粘连汉字的切分,以邮件信函地址为对象,提出了一种离线手写体汉字切分的自适应算法。其基本步骤为:首先,基于灰值投影将手写汉字地址粗分为几个字段;其次,用傅立叶变换判断这些字段是否为粘连字段;再次,用汉字的字高和字宽的比值大小判断非粘连字是单字还是单字的部首;最后,以伸缩框法对粘连字分割,并对过分的部首进行合并。此算法的优势在于根据每个人书写的不同习惯,确定不同的伸缩框对汉字进行分割。
关键词
手写体汉字切分
粘连汉字
投影算法
傅立叶变换
伸缩框
Keywords
segmentation,joined handwritten chinese characters,image-projecting algorithm,fourier transform,flexible frame
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 一种用于手写体汉字切分的优化模型
被引量:2
2
作者
马洋涛
陶志穗
张金焕
杨晓伟
机构
华南理工大学数学科学学院
出处
《计算机工程与应用》
CSCD
北大核心
2008年第2期227-229,共3页
基金
国家自然科学基金( the National Natural Science Foundation of China under Grant No.10471045)
广东省自然科学基金( the Natural Science Foundation of Guangdong Province of China under Grant No.031360
+1 种基金
No.04020079)
广州市天河区科技攻关项目( No.051G041) 。
文摘
在连通域单元的基础上提出了一种手写体汉字切分的优化模型,该模型可以自适应的确定部件、单个字和粘连字的宽度。另外,对粘连字的切分采用了加权k的均值法。整个切分方法既提高了算法的自适应能力,又提高了切分的正确率。实验表明这种方法具有很好的切分效果。
关键词
连通域
最小二乘
无约束
手写体汉字切分
Keywords
connected components
least squares
unconstrained
handwritten Chinese character segmentation
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 基于笔划提取和合并的离线手写体汉字字符切分算法
被引量:8
3
作者
赵宇明
江兴智
施鹏飞
机构
上海交通大学图像处理与模式识别研究所
出处
《红外与激光工程》
EI
CSCD
北大核心
2002年第1期23-27,共5页
文摘
手写体汉字字符切分是离线汉字字符识别预处理中的一个重要问题。针对离线手写体汉字 ,提出一种基于笔划提取和合并的手写体汉字字符切分算法。该算法首先基于方向游程提取汉字的笔划 ,并建立笔划框 ;再根据汉字笔划的结构知识对笔划框进行合并 ,得到字符的切分结果。该算法能较好地解决粘连汉字字符的切分问题 ,对从现场随机采集的 2 5 0 0封手写体信函地址汉字进行切分 ,单字正确率可达 91.5 %。
关键词
手写体汉字切分
离线汉字 识别
汉字 笔划
笔划框
笔划提取
Keywords
Handwritten Chinese character segmentation
\ Off\|line Chinese character recognition
\ Stroke of chinese characters
\ Stroke bounding box
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]