期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
Method to Remove Handwritten Texts Using Smart Phone
1
作者 Haiquan Fang 《Journal of Harbin Institute of Technology(New Series)》 CAS 2024年第2期12-21,共10页
To remove handwritten texts from an image of a document taken by smart phone,an intelligent removal method was proposed that combines dewarping and Fully Convolutional Network with Atrous Convolutional and Atrous Spat... To remove handwritten texts from an image of a document taken by smart phone,an intelligent removal method was proposed that combines dewarping and Fully Convolutional Network with Atrous Convolutional and Atrous Spatial Pyramid Pooling(FCN-AC-ASPP).For a picture taken by a smart phone,firstly,the image is transformed into a regular image by the dewarping algorithm.Secondly,the FCN-AC-ASPP is used to classify printed texts and handwritten texts.Lastly,handwritten texts can be removed by a simple algorithm.Experiments show that the classification accuracy of the FCN-AC-ASPP is better than FCN,DeeplabV3+,FCN-AC.For handwritten texts removal effect,the method of combining dewarping and FCN-AC-ASPP is superior to FCN-AC-ASP alone. 展开更多
关键词 handwritten texts printed texts CLASSIFICATION FCN-AC-ASPP smart phone
下载PDF
Improving CNN-BGRU Hybrid Network for Arabic Handwritten Text Recognition
2
作者 Sofiene Haboubi Tawfik Guesmi +4 位作者 Badr M Alshammari Khalid Alqunun Ahmed S Alshammari Haitham Alsaif Hamid Amiri 《Computers, Materials & Continua》 SCIE EI 2022年第12期5385-5397,共13页
Handwriting recognition is a challenge that interests many researchers around the world.As an exception,handwritten Arabic script has many objectives that remain to be overcome,given its complex form,their number of f... Handwriting recognition is a challenge that interests many researchers around the world.As an exception,handwritten Arabic script has many objectives that remain to be overcome,given its complex form,their number of forms which exceeds 100 and its cursive nature.Over the past few years,good results have been obtained,but with a high cost of memory and execution time.In this paper we propose to improve the capacity of bidirectional gated recurrent unit(BGRU)to recognize Arabic text.The advantages of using BGRUs is the execution time compared to other methods that can have a high success rate but expensive in terms of time andmemory.To test the recognition capacity of BGRU,the proposed architecture is composed by 6 convolutional neural network(CNN)blocks for feature extraction and 1 BGRU+2 dense layers for learning and test.The experiment is carried out on the entire database of institut für nachrichtentechnik/ecole nationale d’ingénieurs de Tunis(IFN/ENIT)without any preprocessing or data selection.The obtained results show the ability of BGRUs to recognize handwritten Arabic script. 展开更多
关键词 Arabic handwritten script handwritten text recognition deep learning IFN/ENIT bidirectional GRU neural network
下载PDF
An Efficient Hybrid Model for Arabic Text Recognition
3
作者 Hicham Lamtougui Hicham El Moubtahij +1 位作者 Hassan Fouadi Khalid Satori 《Computers, Materials & Continua》 SCIE EI 2023年第2期2871-2888,共18页
In recent years,Deep Learning models have become indispensable in several fields such as computer vision,automatic object recognition,and automatic natural language processing.The implementation of a robust and effici... In recent years,Deep Learning models have become indispensable in several fields such as computer vision,automatic object recognition,and automatic natural language processing.The implementation of a robust and efficient handwritten text recognition system remains a challenge for the research community in this field,especially for the Arabic language,which,compared to other languages,has a dearth of published works.In this work,we presented an efficient and new system for offline Arabic handwritten text recognition.Our new approach is based on the combination of a Convolutional Neural Network(CNN)and a Bidirectional Long-Term Memory(BLSTM)followed by a Connectionist Temporal Classification layer(CTC).Moreover,during the training phase of the model,we introduce an algorithm of data augmentation to increase the quality of data.Our proposed approach can recognize Arabic handwritten texts without the need to segment the characters,thus overcoming several problems related to this point.To train and test(evaluate)our approach,we used two Arabic handwritten text recognition databases,which are IFN/ENIT and KHATT.The Experimental results show that our new approach,compared to other methods in the literature,gives better results. 展开更多
关键词 Deep learning arabic handwritten text recognition convolutional neural network(CNN) bidirectional long-term memory(BLSTM) connectionist temporal classification(CTC)
下载PDF
基于多尺度风格自适应的手写维文识别模型
4
作者 闫林 王磊 +2 位作者 艾孜麦提·艾尼瓦尔 杨雅婷 李晓 《计算机工程与设计》 北大核心 2024年第9期2749-2756,共8页
基于字符形态与书写风格的强关联性,提出一种多尺度风格自适应的手写维文识别模型,模型从浅层笔划到深层序列建模多尺度风格特征,提高对手写风格的自适应能力。针对手写维文特点改进Transformer提取多尺度笔划特征;构建多尺度风格自适... 基于字符形态与书写风格的强关联性,提出一种多尺度风格自适应的手写维文识别模型,模型从浅层笔划到深层序列建模多尺度风格特征,提高对手写风格的自适应能力。针对手写维文特点改进Transformer提取多尺度笔划特征;构建多尺度风格自适应模块提取序列特征;构建特征泛化融合模块对笔划特征和序列特征进行深度融合,提升识别效果。实验结果表明,该模型在真实手写维文测试集WER、CER分别下降3.75%、0.19%,在IAM数据集中验证了模型迁移性。 展开更多
关键词 手写维文识别 手写风格 多尺度 特征金字塔网络 视觉自注意力模型 长短期记忆网络 特征融合
下载PDF
基于深度学习的模板化手写表单信息提取方法
5
作者 董前前 陈亮 王鑫鑫 《计算机技术与发展》 2024年第10期204-212,共9页
手写纸质表单作为制造企业各部门之间信息传递的重要数据载体,其关键信息的提取对于企业生产、管理和决策具有重要意义。然而,当前手写表单信息提取方案在复杂文本布局中很难准确快速地抽取关键信息。为解决这一问题,提出了一种两阶段... 手写纸质表单作为制造企业各部门之间信息传递的重要数据载体,其关键信息的提取对于企业生产、管理和决策具有重要意义。然而,当前手写表单信息提取方案在复杂文本布局中很难准确快速地抽取关键信息。为解决这一问题,提出了一种两阶段的模板化手写表单信息提取方法,仅需一张图片即可完成模板搭建,聚焦于用户关心的信息,并规避了传统关系抽取任务在复杂表格中潜在的逻辑错误。首先,对于一个特定种类的表格图片,直接在图像上标注希望识别的区域,并为这些区域分配对应的key值。然后,采用高分辨率网络提高对小文本的检测精确率,并提出多分辨率均匀分割的混洗的策略使得检测模型在性能和参数都取得良好表现。同时引入时域卷积网络和自注意力机制使得识别模型能够较好地应对手写字体由于书写速度和书写工具的原因造成的字迹模糊、不清晰和笔画缺失等情况。识别完成后,系统将识别结果与预设的key值进行绑定,形成结构化的输出。实验结果表明,与典型ResNet50模型相比,在模型参数几乎相等的情况下,小文本检测准确性提升15.8百分点。文本识别任务中,模型在CASIA-HWDB2.0-2.2数据集上的字符准精确率可达99.30%。在文本框未完全涵盖整个文本行的情况下,字符准精确率仅下降0.55百分点,表明文本识别模型具有较好的鲁棒性。 展开更多
关键词 信息提取 手写表单 基于模板 手写文字识别 文本行检测
下载PDF
面向满文档案图像的手写体满文智能识别软件设计与实现
6
作者 孙凯明 孙磊 +3 位作者 王刚 张丽娜 郝明 邢芳芳 《自动化技术与应用》 2024年第1期91-94,共4页
面向黑龙江省档案馆馆藏满文档案数字化平台需求,运用Pytorch、SQL Server和OpenCV,开发了面向满文档案图像的手写体满文智能识别软件。该软件具有文档分割、手写满文单词识别和存储功能。满文历史档案图像分割模块采用基于异向高斯滤... 面向黑龙江省档案馆馆藏满文档案数字化平台需求,运用Pytorch、SQL Server和OpenCV,开发了面向满文档案图像的手写体满文智能识别软件。该软件具有文档分割、手写满文单词识别和存储功能。满文历史档案图像分割模块采用基于异向高斯滤波和连接组件方法实现,手写满文单词识别采用编码器-解码器的网络模型实现,该软件单词识别率达95%以上,已成功集成针对黑龙江省档案馆馆藏满文档案数字化平台建设的满文历史档案管理系统中。手写体满文智能识别技术及软件,为构建集满文档案图像采集、录入、识别、检索与分析为一体的满文档案数字化管理平台作技术支撑,为满族文化的保护和发掘提供先进的技术手段,对推进满文档案数字化和信息化等方面具有重要意义。 展开更多
关键词 满文档案图像 手写文字识别 深度学习
下载PDF
Recognition of Urdu Handwritten Alphabet Using Convolutional Neural Network (CNN)
7
作者 Gulzar Ahmed Tahir Alyas +4 位作者 Muhammad Waseem Iqbal Muhammad Usman Ashraf Ahmed Mohammed Alghamdi Adel A.Bahaddad Khalid Ali Almarhabi 《Computers, Materials & Continua》 SCIE EI 2022年第11期2967-2984,共18页
Handwritten character recognition systems are used in every field of life nowadays,including shopping malls,banks,educational institutes,etc.Urdu is the national language of Pakistan,and it is the fourth spoken langua... Handwritten character recognition systems are used in every field of life nowadays,including shopping malls,banks,educational institutes,etc.Urdu is the national language of Pakistan,and it is the fourth spoken language in the world.However,it is still challenging to recognize Urdu handwritten characters owing to their cursive nature.Our paper presents a Convolutional Neural Networks(CNN)model to recognize Urdu handwritten alphabet recognition(UHAR)offline and online characters.Our research contributes an Urdu handwritten dataset(aka UHDS)to empower future works in this field.For offline systems,optical readers are used for extracting the alphabets,while diagonal-based extraction methods are implemented in online systems.Moreover,our research tackled the issue concerning the lack of comprehensive and standard Urdu alphabet datasets to empower research activities in the area of Urdu text recognition.To this end,we collected 1000 handwritten samples for each alphabet and a total of 38000 samples from 12 to 25 age groups to train our CNN model using online and offline mediums.Subsequently,we carried out detailed experiments for character recognition,as detailed in the results.The proposed CNN model outperformed as compared to previously published approaches. 展开更多
关键词 Urdu handwritten text recognition handwritten dataset convolutional neural network artificial intelligence machine learning deep learning
下载PDF
基于CRNN改进的中文手写体文本行识别 被引量:1
8
作者 舒珊珊 郑晓旭 文成玉 《成都信息工程大学学报》 2023年第4期422-428,共7页
中文手写体文本行识别可以将纸质书写内容转换为可编辑的电子内容。对于手写体书写随意性大、中文字符种类多,且基于字符分割的方法识别准确率不高这些问题,提出基于卷积循环神经网络改进的端到端的中文手写体识别方法。首先将图片传入... 中文手写体文本行识别可以将纸质书写内容转换为可编辑的电子内容。对于手写体书写随意性大、中文字符种类多,且基于字符分割的方法识别准确率不高这些问题,提出基于卷积循环神经网络改进的端到端的中文手写体识别方法。首先将图片传入基于改进的Inception结构的特征提取网络,该网络首先改进GoogLeNet模型,然后在此基础上又改进添加卷积模块的注意力机制模块和Inception组合结构,改进后的模型能更好地提取图片的有效特征;之后将提取到的图片特征传入循环层,即两层双向长短时记忆网络进行预测;最后将预测序列传入转录层,经过连接时序分类进行转录输出。在CASIA-HWDB2数据集的实验结果表明,该方法能获得95.12%的识别准确率,证明方法的可行性。 展开更多
关键词 手写体识别 卷积循环神经网络 卷积模块的注意力机制模块 双向长短时记忆网络 连接时序分类
下载PDF
基于分段式前景涂抹和背景细化的文本行分割 被引量:4
9
作者 易晓芳 卡米力.木依丁 艾斯卡尔.艾木都拉 《计算机工程》 CAS CSCD 2013年第5期204-208,共5页
现有算法对于笔画中含有大量离散笔画点和附加部分的手写体文本,分割性能较低。针对该问题,提出一种基于分段式前景涂抹和背景细化的文本行分割算法。对前景部分实施分段式涂抹,并删除长宽比不满足条件的膨胀区域,以获得文本区域的定位... 现有算法对于笔画中含有大量离散笔画点和附加部分的手写体文本,分割性能较低。针对该问题,提出一种基于分段式前景涂抹和背景细化的文本行分割算法。对前景部分实施分段式涂抹,并删除长宽比不满足条件的膨胀区域,以获得文本区域的定位,利用图像背景的细化获取文本行分割线,给出重心判定算法,从而解决上下文本行之间的文字重叠问题。对210幅图片、2 563个文本行进行实验,结果表明,该算法的出错率仅为3.3%,低于水平投影算法、分段式投影算法和聚类算法,能对文本行进行较为完整的分割。 展开更多
关键词 手写文本 文本行分割 分割性能 涂抹 背景细化
下载PDF
基于连通域特征的维吾尔手写文本行分割 被引量:6
10
作者 易晓芳 卡米力.木依丁 艾斯卡尔.艾木都拉 《计算机工程与应用》 CSCD 2014年第18期142-146,共5页
针对维吾尔文手写体文本中行分割问题,基于连通域大小将图像中文字分为三类,提出了自适应涂抹细化算法,对主体文本行进行定位;并对第三类连通域中相邻两文本行间粘连的字符进行切割;此外,利用重心范围内的邻域搜索算法,解决了剩余笔画... 针对维吾尔文手写体文本中行分割问题,基于连通域大小将图像中文字分为三类,提出了自适应涂抹细化算法,对主体文本行进行定位;并对第三类连通域中相邻两文本行间粘连的字符进行切割;此外,利用重心范围内的邻域搜索算法,解决了剩余笔画的文本行归附问题。实验结果表明,该方法与常见的水平投影法,分段投影法,及涂抹方法相比具有更好的分割效果。 展开更多
关键词 维吾尔文 手写体文本 文本行分割 重心 邻域
下载PDF
面向连续手写文本的部件识别研究 被引量:1
11
作者 赵巍 刘家锋 +1 位作者 唐降龙 郭延辉 《交通运输系统工程与信息》 EI CSCD 2006年第1期51-54,122,共5页
联机连续文本识别是字符识别技术领域中新的研究方向.基于分层构筑法(Level-Building,LB)和动态时间规整算法(Dynamic Time Warping,DTW)建立了面向连续手写文本识别的手写部件识别器.将部件看作笔段和连续文本的中间模式,根据手写文本... 联机连续文本识别是字符识别技术领域中新的研究方向.基于分层构筑法(Level-Building,LB)和动态时间规整算法(Dynamic Time Warping,DTW)建立了面向连续手写文本识别的手写部件识别器.将部件看作笔段和连续文本的中间模式,根据手写文本的特点建立了由484个手写部件构成的部件集.提取笔段的长度、角度等特征用于LB中每一层的DTW网格匹配中.测试样本包括6 763个汉字和303个连续手写文本.实验结果表明手写体部件集能够有效地支撑笔段和连续文本之间的联系,串识别率达到86.47%. 展开更多
关键词 联机连续手写文本 手写部件 对数正态分布 LB与DTW融合算法
下载PDF
基于高阶相关聚类的脱机手写文本行分割 被引量:1
12
作者 殷亚林 刘爱民 周祥东 《华中师范大学学报(自然科学版)》 CAS 北大核心 2017年第1期18-22,34,共6页
从手写文档图像中提取出文本行是文档分析的一个重要预处理步骤,但是由于手写文本行之间通常行方向不平行,甚至存在着交叠和弯曲,所以它仍然是一个具有挑战性的问题.针对该问题,提出了一种基于高阶相关聚类的脱机中文手写文本行的分割算... 从手写文档图像中提取出文本行是文档分析的一个重要预处理步骤,但是由于手写文本行之间通常行方向不平行,甚至存在着交叠和弯曲,所以它仍然是一个具有挑战性的问题.针对该问题,提出了一种基于高阶相关聚类的脱机中文手写文本行的分割算法.首先,使用连通部件构成一个文档超图,然后,在学习所得的相似性度量准则的约束下,通过高阶相关聚类算法将连通部件对标记为属于或者不属于同一文本行;最后,使用union-find算法将连通部件连接成为不同的文本行.该算法在HIT-MW脱机手写数据库上的803幅文档上取得了较好的效果,召回率99.05%,错误率为1.96%. 展开更多
关键词 手写文本行分割 高阶相关聚类 超图
下载PDF
非均匀光照图像中粘连手写体和印刷体的辨别 被引量:7
13
作者 丁红 张晓峰 《计算机工程与设计》 CSCD 北大核心 2012年第12期4634-4638,共5页
针对文档图像光照不均匀以及手写字符与印刷字符接近甚至粘连等问题,提出一套提取字符并区分手写体和印刷体的方案。首先提出一种基于开关映射(toggle mapping,TM)的双阈值二值化方法,用来提取非均匀光照文档图像中的字符;然后将整幅图... 针对文档图像光照不均匀以及手写字符与印刷字符接近甚至粘连等问题,提出一套提取字符并区分手写体和印刷体的方案。首先提出一种基于开关映射(toggle mapping,TM)的双阈值二值化方法,用来提取非均匀光照文档图像中的字符;然后将整幅图像分割成大小相同的网格,从每个网格的邻域中提取边缘特征矩阵。由于相邻网格特征的相似性,使用了基于判别随机场(Discriminative Random Fields,DRF)的分类框架将网格分成手写体和印刷体两类。利用文本行信息的后处理获得更精细、意义更明确的分类结果。在信封邮编区域图像数据库的实验结果表明,提出的方案能够有效提取和辨别非均匀光照文档图像中粘连在一起的手写体和印刷体。另外,在IMA数据库上的实验表明,文中提出的边缘特征矩阵在辨别手写体和印刷体上的性能达到甚至超过以往文献中提出特征的性能。 展开更多
关键词 手写体印刷体辨别 图像二值化 开关映射 边缘特征矩阵 判别随机场
下载PDF
H-Cb混合颜色模型下快递单手写体提取算法研究
14
作者 姜继春 王晓红 许秦蓉 《包装工程》 CAS CSCD 北大核心 2014年第19期114-118,共5页
目的在不受光照条件的影响下,利用H-Cb混合颜色模型,提取快递单底单图像手写体文字信息。方法首先将图像从RGB颜色空间分别转换到HSI颜色空间和YCbCr颜色空间;然后将改进的YCbCr颜色空间的Cb颜色分量与HSI颜色空间的H颜色分量进行信息融... 目的在不受光照条件的影响下,利用H-Cb混合颜色模型,提取快递单底单图像手写体文字信息。方法首先将图像从RGB颜色空间分别转换到HSI颜色空间和YCbCr颜色空间;然后将改进的YCbCr颜色空间的Cb颜色分量与HSI颜色空间的H颜色分量进行信息融合;最后对提取出的手写体文字信息进行阈值和反相处理,并将该算法提取结果与基于YCbCr颜色空间Cb颜色分量阈值分割方法和基于Lab颜色空间的手写文字聚类算法的提取结果,在分割效果、文字识别率上进行对比。结果利用H-Cb混合颜色模型检测出的手写体文字更准确,具有更高的识别率,在理想文字切分条件下识别率达96%。结论使用H-Cb混合颜色模型提取手写文字受光照条件影响小,提取出的图像噪声小、识别率高,算法简单可行,为彩色图像的检测与判定技术提供了支撑。 展开更多
关键词 H-Cb混合颜色模型 手写体文字 识别率 提取算法
下载PDF
基于改进Hough变换的手写信函书写线去除方法 被引量:1
15
作者 江兴智 赵宇明 《上海铁道大学学报》 CAS 2000年第6期62-66,共5页
在文本识别预处理中 ,书写线的去除是一重要工作。采用标准Hough变换的主要缺点在于它需要的存储空间量大和计算时间长。提出了改进Hough变换 ,通过空间复用减少了空间要求和重复运算 ,加快了计算速度 ,并结合实际 ,通过限定角度搜索范... 在文本识别预处理中 ,书写线的去除是一重要工作。采用标准Hough变换的主要缺点在于它需要的存储空间量大和计算时间长。提出了改进Hough变换 ,通过空间复用减少了空间要求和重复运算 ,加快了计算速度 ,并结合实际 ,通过限定角度搜索范围和提取特征点 。 展开更多
关键词 图像处理 HOUGH变换 文本处理 书写线去除
下载PDF
维吾尔语手写体在线计算机识别技术研究
16
作者 齐向伟 艾孜尔古丽 玉素甫 《数字技术与应用》 2015年第12期118-119,共2页
维吾尔语是以单词为基本单位的黏连语,字母因在单词中位置的不同而具有不同的书写变形,目前手写技术的发展仍然落后于汉语、英语等语种。本文在分析维吾尔语言文字的结构、构词特点和输入习惯等特征的基础上,总结了黏着性语言对手写输... 维吾尔语是以单词为基本单位的黏连语,字母因在单词中位置的不同而具有不同的书写变形,目前手写技术的发展仍然落后于汉语、英语等语种。本文在分析维吾尔语言文字的结构、构词特点和输入习惯等特征的基础上,总结了黏着性语言对手写输入识别的影响,主要探讨了实现维吾尔文手写识别系统的过程和相关关键技术,以期通过对这些技术的分析、验证,实现维吾尔文手写识别系统。 展开更多
关键词 维吾尔文 手写体 在线识别
下载PDF
基于可变窗口的古代手写汉字多步切分方法 被引量:6
17
作者 吴相锦 张忠林 周生龙 《计算机工程与设计》 北大核心 2016年第4期1102-1106,共5页
根据古文献和古代手写体汉字纵向书写,上下字多粘连、多重叠等特点,提出一种基于可变窗口的古代手写汉字多步切分方法。对古文献进行列切分,列切分采用投影过滤的方法,采用投影法对手写字进行粗切分,对存在粘连或重叠的字串采用可变窗... 根据古文献和古代手写体汉字纵向书写,上下字多粘连、多重叠等特点,提出一种基于可变窗口的古代手写汉字多步切分方法。对古文献进行列切分,列切分采用投影过滤的方法,采用投影法对手写字进行粗切分,对存在粘连或重叠的字串采用可变窗口的方法进行细切分,确定字串中每一个单字的切分路径。实验结果表明,该方法能够有效应用于古文献中手写汉字的切分。 展开更多
关键词 古文献 手写汉字 列切分 汉字切分 可变窗口 切分路径
下载PDF
脱机手写维吾尔文本图像单词切分 被引量:2
18
作者 阿依萨代提.阿卜力孜 加合买提.司马义 +1 位作者 卡米力.木依丁 艾斯卡尔.艾木都拉 《计算机工程与应用》 CSCD 北大核心 2018年第9期133-138,共6页
针对脱机手写维吾尔文本行图像中单词切分问题,提出了FCM融合K-means的聚类算法。通过该算法得到单词内距离和单词间距离两种分类。以聚类结果为依据,对文字区域进行合并,得到切分点,再对切分点内的文字进行连通域标注,进行着色处理。... 针对脱机手写维吾尔文本行图像中单词切分问题,提出了FCM融合K-means的聚类算法。通过该算法得到单词内距离和单词间距离两种分类。以聚类结果为依据,对文字区域进行合并,得到切分点,再对切分点内的文字进行连通域标注,进行着色处理。以50幅不同的人书写的维吾尔脱机手写文本图像为实验对象,共有536行和4 002个单词,正确切分率达到80.68%。实验结果表明,该方法解决了手写维吾尔文在切分过程中,单词间距离不规律带来的切分困难的问题和一些单词间重叠的问题。同时实现了大篇幅手写文本图像的整体处理。 展开更多
关键词 维吾尔文 手写文本图像 单词切分 聚类 着色处理
下载PDF
基于卷积神经网络和Transformer的手写体英文文本识别 被引量:3
19
作者 张显杰 张之明 《计算机应用》 CSCD 北大核心 2022年第8期2394-2400,共7页
手写体文本识别技术可以将手写文档转录成可编辑的数字文档。但由于手写的书写风格迥异、文档结构千变万化和字符分割识别精度不高等问题,基于神经网络的手写体英文文本识别仍面临着许多挑战。针对上述问题,提出基于卷积神经网络(CNN)和... 手写体文本识别技术可以将手写文档转录成可编辑的数字文档。但由于手写的书写风格迥异、文档结构千变万化和字符分割识别精度不高等问题,基于神经网络的手写体英文文本识别仍面临着许多挑战。针对上述问题,提出基于卷积神经网络(CNN)和Transformer的手写体英文文本识别模型。首先利用CNN从输入图像中提取特征,而后将特征输入到Transformer编码器中得到特征序列每一帧的预测,最后经过链接时序分类(CTC)解码器获得最终的预测结果。在公开的IAM(Institut für Angewandte Mathematik)手写体英文单词数据集上进行了大量的实验结果表明,该模型获得了3.60%的字符错误率(CER)和12.70%的单词错误率(WER),验证了所提模型的可行性。 展开更多
关键词 手写体英文文本识别 深度学习 卷积神经网络 TRANSFORMER 链接时序分类 注意力 无分割
下载PDF
Attention机制在脱机中文手写体文本行识别中的应用 被引量:6
20
作者 王馨悦 董兰芳 《小型微型计算机系统》 CSCD 北大核心 2019年第9期1876-1880,共5页
脱机中文手写体识别技术可以将人工书写在纸上的汉字转换为电子文档中可编辑的中文格式.由于每个人的书写习惯不同,所以手写体随意性较大、字符之间可能存在粘连,给字符分割增加了难度.为了避免单个字符的分割,本文采用基于Attention的... 脱机中文手写体识别技术可以将人工书写在纸上的汉字转换为电子文档中可编辑的中文格式.由于每个人的书写习惯不同,所以手写体随意性较大、字符之间可能存在粘连,给字符分割增加了难度.为了避免单个字符的分割,本文采用基于Attention的方法实现脱机中文手写体文本行的识别.该方法基于encoder-decoder框架,首先用CNN提取特征,然后通过BLSTM进行编码,最后将BLSTM的输出结果再结合Attention,输入到LSTM进行解码.该方法在针对具有语义信息的CASIA-HWDB2. 0-2. 2数据集上字符准确率达到了95. 76%,比传统的encoder-decoder框架提升了12. 83%. 展开更多
关键词 文本行识别 脱机中文手写体 Attention机制 LSTM
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部