期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
A 4-Corner Codes Classifier Based on Decision Tree Inductive Learning for Handwritten Chinese Characters
1
作者 钱国良 王亚东 舒文豪 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 1998年第2期26-31,共6页
The classification for handwritten Chinese character recognition can be viewed as a transformation in discrete vector space. In this paper, from the point of discrete vector space transformation, a new 4-corner codes ... The classification for handwritten Chinese character recognition can be viewed as a transformation in discrete vector space. In this paper, from the point of discrete vector space transformation, a new 4-corner codes classifier based on decision tree inductive learning algorithm ID3 for handwritten Chinese characters is presented. With a feature extraction controller, the classifier can reduce the number of extracted features and accelerate classification speed. Experimental results show that the 4-corner codes classifier performs well on both recognition accuracy and speed. 展开更多
关键词 Handwritten chinese character recognition classification discrete vector space transformation DECISION tree INDUCTIVE learning 4-corner codeS
下载PDF
多文种环境下汉字内码识别算法的研究 被引量:16
2
作者 李培峰 朱巧明 钱培德 《中文信息学报》 CSCD 北大核心 2004年第2期73-79,共7页
汉字内码向ISO/IEC 10 6 46过渡是实现计算机用文字编码统一的必然趋势 ,但目前在一段时间内仍将存在多种汉字内码并存的情况 ,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中... 汉字内码向ISO/IEC 10 6 46过渡是实现计算机用文字编码统一的必然趋势 ,但目前在一段时间内仍将存在多种汉字内码并存的情况 ,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中实现汉字内码自动识别的问题 ,并提供了多种汉字内码识别算法 ,包括基于内码分布、标点符号特征、字频特征和语义特征的识别算法等。在此基础上 ,本文对不同的识别算法进行分析和评估。在对目标样本的测试中 ,以上算法的识别率最高可以达到 99 9%以上。 展开更多
关键词 计算机应用 中文信息处理 多文种环境 汉字内码 识别算法
下载PDF
深度学习在手写汉字识别中的应用综述 被引量:108
3
作者 金连文 钟卓耀 +3 位作者 杨钊 杨维信 谢泽澄 孙俊 《自动化学报》 EI CSCD 北大核心 2016年第8期1125-1141,共17页
手写汉字识别(Handwritten Chinese character recognition,HCCR)是模式识别的一个重要研究领域,最近几十年来得到了广泛的研究与关注,随着深度学习新技术的出现,近年来基于深度学习的手写汉字识别在方法和性能上得到了突破性的进展.本... 手写汉字识别(Handwritten Chinese character recognition,HCCR)是模式识别的一个重要研究领域,最近几十年来得到了广泛的研究与关注,随着深度学习新技术的出现,近年来基于深度学习的手写汉字识别在方法和性能上得到了突破性的进展.本文综述了深度学习在手写汉字识别领域的研究进展及具体应用.首先介绍了手写汉字识别的研究背景与现状.其次简要概述了深度学习的几种典型结构模型并介绍了一些主流的开源工具,在此基础上详细综述了基于深度学习的联机和脱机手写汉字识别的方法,阐述了相关方法的原理、技术细节、性能指标等现状情况,最后进行了分析与总结,指出了手写汉字识别领域仍需要解决的问题及未来的研究方向. 展开更多
关键词 深度学习 手写汉字识别 卷积神经网络 回归神经网络 长短时记忆模型 层叠自动编码机
下载PDF
一个基于多代码页的中文屏幕实时解释引擎的设计 被引量:2
4
作者 李培峰 朱巧明 钱培德 《中文信息学报》 CSCD 北大核心 2005年第5期90-96,共7页
目前,在计算机中汉字有多种代码页,汉字的多代码页并存现象将长期存在。为了实现汉字多代码页并存,需要汉字代码页自动识别技术的支撑。屏幕实时解释引擎是目前各种在线字典、词典以及教学软件的核心技术,此技术目前存在不能跨代码页,... 目前,在计算机中汉字有多种代码页,汉字的多代码页并存现象将长期存在。为了实现汉字多代码页并存,需要汉字代码页自动识别技术的支撑。屏幕实时解释引擎是目前各种在线字典、词典以及教学软件的核心技术,此技术目前存在不能跨代码页,取词不全面、不正确等缺陷。本文主要针对以上情况,描述了采用汉字内码的代码页自动识别技术以及优化的自动屏幕取词技术的中文屏幕实时解释引擎的系统架构,并阐述了数据词典的设计以及在设计中采用的关键技术。对五百万汉字样本的测试中,应用此引擎的在线词典对有意义短字符串(不包括单字)代码页的识别率可以达到99%以上。 展开更多
关键词 计算机应用 中文信息处理 汉字代码页自动识别 屏幕取词 ISO10646
下载PDF
基于词平台汉字编码的自动标引研究 被引量:3
5
作者 焦慧 刘迁 贾惠波 《计算机工程与应用》 CSCD 北大核心 2007年第15期173-175,共3页
自动标引是基于内容检索的关键技术之一。目前国内的汉语自动标引研究主要集中于汉语自动分词这个前期处理问题上。提出了一种基于词平台的汉字编码方法,建立了一种新的中文计算机文档表达格式,使词成为最小的信息单位,汉语分析无需再... 自动标引是基于内容检索的关键技术之一。目前国内的汉语自动标引研究主要集中于汉语自动分词这个前期处理问题上。提出了一种基于词平台的汉字编码方法,建立了一种新的中文计算机文档表达格式,使词成为最小的信息单位,汉语分析无需再进行自动分词,可直接进行自动标引,从而提高自动标引的效率和质量。 展开更多
关键词 自动标引 词平台 汉字编码 自动分词
下载PDF
一种脱机手写体汉字识别的容错编码方法研究 被引量:4
6
作者 王建平 赵丽欣 王金玲 《中国图象图形学报》 CSCD 北大核心 2007年第12期2169-2178,共10页
手写体汉字识别是字符识别领域中的难点。为了使机器识别汉字适应于手写体汉字的变形等因素,基于人类认识汉字的容错机理,提出了一种用于机器识字的汉字容错编码方法,以提高手写体汉字识别率。该编码方法首先对横竖撇捺笔划形态给出了... 手写体汉字识别是字符识别领域中的难点。为了使机器识别汉字适应于手写体汉字的变形等因素,基于人类认识汉字的容错机理,提出了一种用于机器识字的汉字容错编码方法,以提高手写体汉字识别率。该编码方法首先对横竖撇捺笔划形态给出了模糊化表示;然后定义了仿人拆字的字元集,并给出了易混淆笔划字元的多归类容错编码;接着给出了笔划字元的顺序判断规则和归结了36类简单常用字的部首子结构,并给出冗余的容错编码;进而建立了仿人构字的汉字编码规则和具有容错性的多模板字典,并对《新华字典》中收录的10000余个单字汉字进行了标准编码,重码率为0.48%;最后对HCCORG和NKIM手写体汉字库中的100个手写体汉字进行了仿真识别,识别正确率为96%。试验结果表明,这种编码方法可生成多模板字典,不仅对手写体汉字变形具有较好的容错性,且重码率和误识率较低。 展开更多
关键词 脱机手写体汉字识别 容错编码 字元集 笔划顺序 子结构
下载PDF
特殊票据字符识别预分类特征的提取及分类字典的建立 被引量:1
7
作者 吴晓娟 郭琳 +1 位作者 张博洋 王昭君 《山东大学学报(工学版)》 CAS 2002年第6期537-540,共4页
从特殊票据———火车票票面字符的特点出发 ,将笔划复杂性指数与四周面积编码结合起来作为粗分类的分类特征 采用C -均值聚类算法进行预分类 最后生成分类特征库———分类字典 .得到了预期的分类效果 ,正确分类率达到 95 % .
关键词 汉字识别 分类 笔划元素 代数编码
下载PDF
一种联机手写笔画滤波算法的设计与实现 被引量:1
8
作者 俞庆英 刘莉 陈传明 《计算机时代》 2010年第8期35-37,共3页
引入方向代码的概念,将联机手写笔画的运动轨迹转换成由方向代码组成的序列。通过分析代码序列中的噪声因素,归纳了噪声的种类,进而设计并实现了一种基于方向代码序列的滤波算法,为联机手写汉字的识别奠定了基础。结合实验完成了滤波、... 引入方向代码的概念,将联机手写笔画的运动轨迹转换成由方向代码组成的序列。通过分析代码序列中的噪声因素,归纳了噪声的种类,进而设计并实现了一种基于方向代码序列的滤波算法,为联机手写汉字的识别奠定了基础。结合实验完成了滤波、归并和匹配各个过程的设计,从而完成了单笔画及连笔部件的识别。 展开更多
关键词 联机手写汉字识别 笔画 方向代码 滤波
下载PDF
汉字笔顺识别的算法与实现 被引量:1
9
作者 李正华 《娄底师专学报》 2004年第2期39-40,共2页
提出了一种点阵汉字的笔顺字模的描述方法以及基于这种描述方法的汉字笔顺识别的算法和实现。
关键词 汉字笔顺识别 识别算法 点阵汉字
下载PDF
低频汉字识别中语音与字形的作用机制研究——基于听障大学生与健听大学生的比较
10
作者 王志强 王雁 《现代特殊教育》 2017年第12期14-19,共6页
研究采用语义一致性判断任务方法,通过操纵干扰项和目标项在语音和字形上的相似性、改变刺激呈现进程并比较听障大学生与健听大学生的反应特征,探讨低频汉字识别中语音、字形的作用机制。研究发现,语音、字形均在汉字识别的早期阶段激活... 研究采用语义一致性判断任务方法,通过操纵干扰项和目标项在语音和字形上的相似性、改变刺激呈现进程并比较听障大学生与健听大学生的反应特征,探讨低频汉字识别中语音、字形的作用机制。研究发现,语音、字形均在汉字识别的早期阶段激活,并分别通过发音核证与书写核证检验起到减少汉字形似性、同音性对汉字识别干扰的作用。同时,一致性对汉字识别中语音激活产生影响。在此基础上,研究探讨了发音核证检验与书写核证检验的文字学基础。 展开更多
关键词 汉字识别 低频字 语音 字形 实验研究
下载PDF
一种手写体汉字快速细化分割算法
11
作者 刘平 《重庆大学学报(自然科学版)》 EI CAS CSCD 1991年第4期78-85,共8页
提出了一种基于游程编码(run length encoding)的手写体汉字细化和分割快速算法。数据的输入与处理并行,汉字图象数据所占存贮空间仅为点阵方式的1/400。能将任何复杂汉字细化并分割为简单直线和弧线笔划。对汉字的结构特征抽取极为有... 提出了一种基于游程编码(run length encoding)的手写体汉字细化和分割快速算法。数据的输入与处理并行,汉字图象数据所占存贮空间仅为点阵方式的1/400。能将任何复杂汉字细化并分割为简单直线和弧线笔划。对汉字的结构特征抽取极为有利。此外,本文还提出一种新的边沿描述基段链码,其平均长度比Freeman链码短20%。 展开更多
关键词 汉字识别 细化分割算法 计算机
下载PDF
基于卷积神经网络的汉字编码标记点检测识别 被引量:17
12
作者 陶聪 施云 张丽艳 《仪器仪表学报》 EI CAS CSCD 北大核心 2019年第8期191-200,共10页
近景摄影测量中采用的标记点要求具有唯一身份号并能在图像中被精确识别定位。设计了一种以汉字作为编码特征的编码标记点,提出了一种基于卷积神经网络的编码标记点检测识别方法。首先采用基于相机成像原理的虚拟相机法,自动生成大量汉... 近景摄影测量中采用的标记点要求具有唯一身份号并能在图像中被精确识别定位。设计了一种以汉字作为编码特征的编码标记点,提出了一种基于卷积神经网络的编码标记点检测识别方法。首先采用基于相机成像原理的虚拟相机法,自动生成大量汉字编码点模拟图像作为训练样本,并据此训练卷积神经网络成为汉字编码点识别网络。根据一系列编码点筛选准则分割得到实拍汉字编码点,然后用编码点识别网络对其身份号进行识别,最后通过中心定位算法定位编码点中心。实验结果表明构建的识别网络对汉字编码点识别率可达97. 67%,且受噪声、投影角度、图像对比度、亮度等因素的影响小;分割算法鲁棒性强,能准确分割出汉字编码点;中心定位算法对编码点中心的定位精度高。 展开更多
关键词 近景摄影测量 汉字编码标记点 卷积神经网络 图像分割 图像识别 中心定位
下载PDF
基于Faster-RCNN的水书古籍手写文字的检测与识别 被引量:3
13
作者 汤敏丽 谢少敏 刘向荣 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期272-277,共6页
中国非物质文化遗产水书文化面临失传威胁,近年大量深度学习的方法用于手写古籍文字的识别.但水书古籍文字识别面临数据集建立和标注困难、样本不平衡等问题,研究进展不大,且鲜少进行水书古籍页面级的文字检测与识别.首先建立了一个较... 中国非物质文化遗产水书文化面临失传威胁,近年大量深度学习的方法用于手写古籍文字的识别.但水书古籍文字识别面临数据集建立和标注困难、样本不平衡等问题,研究进展不大,且鲜少进行水书古籍页面级的文字检测与识别.首先建立了一个较大规模的水书手写文字数据集,通过几种数据扩增方式,获得包含80个文字类别,共110610个带标签的字符样本.将Faster-RCNN(faster-region based convolutional neural network)算法应用到水书古籍文字识别研究上,以不同组合的数据集作为输入进行实验,在全部80个目标类别上获得了91.95%的平均识别率,实现了页面级的端到端的水书古籍文字的准确定位与识别.实验结果表明,Faster-RCNN模型在目前的数据集上能很好地实现水书手写文字的检测与识别,文中采用的数据扩增方式能明显提升水书手写文字的识别率,为水书文化的保护和传承提供了新思路,对于解决实际应用场景中的水书文字识别问题具有重要意义. 展开更多
关键词 水书 手写中文文字识别 Faster-RCNN 页面级文字识别 数据扩增
下载PDF
128条码的编码分析和识别算法 被引量:9
14
作者 战荫伟 《计算机工程与科学》 CSCD 2002年第1期74-76,80,共4页
本文对 1 2 8条码的编码进行了理论分析 ,证明了由相似边距离确定其编码的唯一性 ,并据此给出了一种适于批量表格录入的识别条码的有效算法。
关键词 128条码 图象识别 汉字编码 算法 计算机
下载PDF
语音与字形在高频汉字识别中的作用——基于听障大学生与健听大学生的比较研究 被引量:7
15
作者 王志强 王雁 《中国特殊教育》 CSSCI 北大核心 2016年第11期26-31,43,共7页
本研究采用语义一致性判断任务,通过操纵干扰项和目标项在字形和语音上的相似性、改变刺激呈现进程、以及比较听障大学生与健听大学生的反应特征探讨语音、字形在高频汉字识别中的作用。研究发现,语音、字形均在汉字识别的早期阶段激活... 本研究采用语义一致性判断任务,通过操纵干扰项和目标项在字形和语音上的相似性、改变刺激呈现进程、以及比较听障大学生与健听大学生的反应特征探讨语音、字形在高频汉字识别中的作用。研究发现,语音、字形均在汉字识别的早期阶段激活,并分别通过发音核证检验、书写核证检验起到减少汉字形似性、同音性对汉字识别干扰的作用。同时,一致性对汉字识别中语音的激活产生影响。 展开更多
关键词 汉字识别 高频字 语音 字形 实验研究
原文传递
基于MHMM模型的手写体汉字识别算法 被引量:3
16
作者 刘健 李会方 牛新伟 《信息安全与通信保密》 2007年第2期75-77,共3页
文章提出了一种基于多重隐马尔可夫模型和区域投影变换的手写体汉字识别新方法。该方法对每个汉字建立4个HMM,通过等比重综合方法将4个分类器的计算结果进行综合,从而得到识别结果。该方法对于识别应用问题中的隐马尔可夫建模具有普适... 文章提出了一种基于多重隐马尔可夫模型和区域投影变换的手写体汉字识别新方法。该方法对每个汉字建立4个HMM,通过等比重综合方法将4个分类器的计算结果进行综合,从而得到识别结果。该方法对于识别应用问题中的隐马尔可夫建模具有普适性。实验证明,该识别方法具有较高的识别准确率。 展开更多
关键词 汉字识别 特征提取 多重隐马尔可夫模型 边界链编码
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部