期刊文献+
共找到91篇文章
< 1 2 5 >
每页显示 20 50 100
Optimised CNN Architectures for Handwritten Arabic Character Recognition
1
作者 Salah Alghyaline 《Computers, Materials & Continua》 SCIE EI 2024年第6期4905-4924,共20页
Handwritten character recognition is considered challenging compared with machine-printed characters due to the different human writing styles.Arabic is morphologically rich,and its characters have a high similarity.T... Handwritten character recognition is considered challenging compared with machine-printed characters due to the different human writing styles.Arabic is morphologically rich,and its characters have a high similarity.The Arabic language includes 28 characters.Each character has up to four shapes according to its location in the word(at the beginning,middle,end,and isolated).This paper proposed 12 CNN architectures for recognizing handwritten Arabic characters.The proposed architectures were derived from the popular CNN architectures,such as VGG,ResNet,and Inception,to make them applicable to recognizing character-size images.The experimental results on three well-known datasets showed that the proposed architectures significantly enhanced the recognition rate compared to the baseline models.The experiments showed that data augmentation improved the models’accuracies on all tested datasets.The proposed model outperformed most of the existing approaches.The best achieved results were 93.05%,98.30%,and 96.88%on the HIJJA,AHCD,and AIA9K datasets. 展开更多
关键词 optical character recognition(ocr) handwritten arabic characters deep learning
下载PDF
Arabic Optical Character Recognition:A Review 被引量:1
2
作者 Salah Alghyaline 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第6期1825-1861,共37页
This study aims to review the latest contributions in Arabic Optical Character Recognition(OCR)during the last decade,which helps interested researchers know the existing techniques and extend or adapt them accordingl... This study aims to review the latest contributions in Arabic Optical Character Recognition(OCR)during the last decade,which helps interested researchers know the existing techniques and extend or adapt them accordingly.The study describes the characteristics of the Arabic language,different types of OCR systems,different stages of the Arabic OCR system,the researcher’s contributions in each step,and the evaluationmetrics for OCR.The study reviews the existing datasets for the Arabic OCR and their characteristics.Additionally,this study implemented some preprocessing and segmentation stages of Arabic OCR.The study compares the performance of the existing methods in terms of recognition accuracy.In addition to researchers’OCRmethods,commercial and open-source systems are used in the comparison.The Arabic language is morphologically rich and written cursive with dots and diacritics above and under the characters.Most of the existing approaches in the literature were evaluated on isolated characters or isolated words under a controlled environment,and few approaches were tested on pagelevel scripts.Some comparative studies show that the accuracy of the existing Arabic OCR commercial systems is low,under 75%for printed text,and further improvement is needed.Moreover,most of the current approaches are offline OCR systems,and there is no remarkable contribution to online OCR systems. 展开更多
关键词 Arabic optical character recognition(ocr) Arabic ocr software Arabic ocr datasets Arabic ocr evaluation
下载PDF
Support Vector Machine Based Handwritten Hindi Character Recognition and Summarization
3
作者 Sunil Dhankhar Mukesh Kumar Gupta +3 位作者 Fida Hussain Memon Surbhi Bhatia Pankaj Dadheech Arwa Mashat 《Computer Systems Science & Engineering》 SCIE EI 2022年第10期397-412,共16页
In today’s digital era,the text may be in form of images.This research aims to deal with the problem by recognizing such text and utilizing the support vector machine(SVM).A lot of work has been done on the English l... In today’s digital era,the text may be in form of images.This research aims to deal with the problem by recognizing such text and utilizing the support vector machine(SVM).A lot of work has been done on the English language for handwritten character recognition but very less work on the under-resourced Hindi language.A method is developed for identifying Hindi language characters that use morphology,edge detection,histograms of oriented gradients(HOG),and SVM classes for summary creation.SVM rank employs the summary to extract essential phrases based on paragraph position,phrase position,numerical data,inverted comma,sentence length,and keywords features.The primary goal of the SVM optimization function is to reduce the number of features by eliminating unnecessary and redundant features.The second goal is to maintain or improve the classification system’s performance.The experiment included news articles from various genres,such as Bollywood,politics,and sports.The proposed method’s accuracy for Hindi character recognition is 96.97%,which is good compared with baseline approaches,and system-generated summaries are compared to human summaries.The evaluated results show a precision of 72%at a compression ratio of 50%and a precision of 60%at a compression ratio of 25%,in comparison to state-of-the-art methods,this is a decent result. 展开更多
关键词 Support vector machine(SVM) optimization PRECISION Hindi character recognition optical character recognition(ocr) automatic summarization and compression ratio
下载PDF
基于OCR和Pydicom的PACS数据库数据丢失后的应急与恢复研究
4
作者 朱贵鲜 李桃 +1 位作者 俞磊 丁如一 《中国医疗设备》 2024年第7期74-78,89,共6页
目的在影像归档和通信系统(Picture Archiving and Communication System,PACS)数据库文件丢失或损坏后,实现影像资料和PDF报告关键信息的快速识别和重组,供患者回诊使用。方法利用基于深度学习的光学字符识别技术和Pydicom技术分别读取... 目的在影像归档和通信系统(Picture Archiving and Communication System,PACS)数据库文件丢失或损坏后,实现影像资料和PDF报告关键信息的快速识别和重组,供患者回诊使用。方法利用基于深度学习的光学字符识别技术和Pydicom技术分别读取PDF和DCOM文件中的基本信息,重新建立起患者、影像、报告三者之间的联系,并将关联数据写入数据库。结果经抽样验证,该方法识别同类图像精度的准确度、精准度及召回率均为100%,综合指标F1值为1,在不同组别独立样本间的识别精度表现出一致性。平均每份报告识别时间约为0.14 s(t=-1.005,P=0.315),说明不同组别独立样本间的识别时间表现出一致性。结论该方法的使用能有效缩短数据库故障后患者等待时长,能够在短时间内恢复医疗秩序,可用于PACS数据库数据丢失后的应急处置,也为PACS的数据整合提供依据,为医学影像数据恢复和数据整合提供一种新思路。 展开更多
关键词 光学字符识别 PACS数据 应急处置 深度学习 DCOM信息提取 图像文字识别
下载PDF
基于OCR模型的通信机房图片归档系统设计 被引量:2
5
作者 周延熙 《信息与电脑》 2024年第1期125-127,共3页
目前通信机房图片归档,人工操作占据了主导地位,然而这种方式存在效率低、易出错等缺陷。在此背景下,文章提出了一种基于光学字符识别(Optical Character Recognition,OCR)模型的通信机房图片归档系统。该系统通过自动识别图片中的文字... 目前通信机房图片归档,人工操作占据了主导地位,然而这种方式存在效率低、易出错等缺陷。在此背景下,文章提出了一种基于光学字符识别(Optical Character Recognition,OCR)模型的通信机房图片归档系统。该系统通过自动识别图片中的文字信息,分析图片所属的机房位置,进而按照机柜位置分类归档图片,实现自动化管理。经过测试,该系统的归档准确率达到了98%以上,显著提高了通信机房图片归档的效率。 展开更多
关键词 图片归档系统 光学字符识别(ocr) 通信机房
下载PDF
利用OCR识别技术实现视频中文字的提取 被引量:22
6
作者 陈义 李言俊 孙小炜 《计算机工程与应用》 CSCD 北大核心 2010年第10期180-183,共4页
为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方... 为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方法,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘。应用投影法最终确定视频字幕所在区域。最后,利用OCR识别技术对提取出来的文字区域进行识别,完成视频中文字的提取。以上方法的结合保证了提出算法的正确率和鲁棒性。 展开更多
关键词 光学文字识别 文字事件检测 数字视频
下载PDF
新的基于统计熵功率的OCR算法及其DMCU实现 被引量:4
7
作者 吴永亮 万旺根 +1 位作者 钱锋 徐鸿玮 《计算机工程与应用》 CSCD 北大核心 2009年第1期195-197,共3页
使用摄像头进行文字识别最大的问题在于图像抖动。为了有效地消除图像抖动并正确实现文字识别,提出了一种基于统计熵功率的新的识别算法。这种方法将采集到的数据作为随机信号处理。实验证明,此算法计算复杂度低,识别率高,适用于低成本... 使用摄像头进行文字识别最大的问题在于图像抖动。为了有效地消除图像抖动并正确实现文字识别,提出了一种基于统计熵功率的新的识别算法。这种方法将采集到的数据作为随机信号处理。实验证明,此算法计算复杂度低,识别率高,适用于低成本嵌入式系统,在中国台湾俊亿公司24MHZ16位DMCU嵌入式系统上,获得了94%以上的正确识别率。 展开更多
关键词 统计 熵功率 文字识别
下载PDF
基于OCR识别技术的自动阅卷系统的研究 被引量:4
8
作者 马壮 赵国权 任占鹏 《河北工业科技》 CAS 2005年第6期354-357,共4页
利用光学字符识别(OCR)技术,设计的自动阅卷系统,不仅能够实现对答题卡的自动阅卷工作,还可以完成成绩的统计和成绩单的打印工作,已在实际中得到应用。结果表明该系统提高了考试阅卷工作的效率,与一般的自动阅卷系统相比,有着独特的优点... 利用光学字符识别(OCR)技术,设计的自动阅卷系统,不仅能够实现对答题卡的自动阅卷工作,还可以完成成绩的统计和成绩单的打印工作,已在实际中得到应用。结果表明该系统提高了考试阅卷工作的效率,与一般的自动阅卷系统相比,有着独特的优点,应用前景广阔。 展开更多
关键词 ocr 识别技术 自动阅卷 DELPHI7.0
下载PDF
基于霍夫变换的铭牌OCR图像旋转矫正方法 被引量:14
9
作者 张勇红 《电测与仪表》 北大核心 2015年第8期125-128,共4页
在对互感器铭牌图像进行扫描输入时,铭牌图像或多或少会出现一定程度的倾斜,这种图像的倾斜最终会导致其字符识别准确率下降。针对此问题提出一种基于霍夫变换获取图像倾斜角度,进而通过图像旋转矫正提高光学字符识别(Optical Character... 在对互感器铭牌图像进行扫描输入时,铭牌图像或多或少会出现一定程度的倾斜,这种图像的倾斜最终会导致其字符识别准确率下降。针对此问题提出一种基于霍夫变换获取图像倾斜角度,进而通过图像旋转矫正提高光学字符识别(Optical Character Recognition,OCR)准确率的方法:首先对原始图像进行二值化,进而获得铭牌的轮廓,再采用基于霍夫变换的方法获得铭牌中的水平线段,通过计算得到线段的水平倾斜角,利用此倾角对图像进行还原。实验结果表明,该方法能快速地计算图像的倾斜角度,提高了OCR识别准确率且准确率可达95%以上。 展开更多
关键词 ocr 字符识别 霍夫变换 旋转矫正
下载PDF
基于OCR光学字符识别的翻译优化方法 被引量:9
10
作者 王晓艺 高挺挺 《激光杂志》 北大核心 2020年第12期156-160,共5页
以转化并翻译纸张等载体上文本资料为数字化信息为目标,提出一种基于OCR光学字符识别的翻译优化方法。利用具备摄像功能的设备拍摄含待翻译字符的图像,图像预处理时采用区域灰度差生长算法和叠加灰度值方式判断原始图像中背景信息和表... 以转化并翻译纸张等载体上文本资料为数字化信息为目标,提出一种基于OCR光学字符识别的翻译优化方法。利用具备摄像功能的设备拍摄含待翻译字符的图像,图像预处理时采用区域灰度差生长算法和叠加灰度值方式判断原始图像中背景信息和表格线条,去除原始图像中非字符像素干扰,得到二值化文本图像;图像分割时采用基于改进FCM聚类算法的图像分割方法,利用小波多尺度图像框架,引入时效性函数,降低二值化文本图像分割计算量,充分考虑相邻域信息,解决图像分割缺陷及干扰,获取二值化文本图像单个字符或单词;依据一阶Minkowski距离实现分割后的图像特征分类后,利用后处理方式结合上下文信息展开特征分类结果的进一步处理,提升翻译准确度。实验结果表明:所提方法可实现文字的精准翻译,应用效果较好。 展开更多
关键词 ocr 光学字符 识别 翻译 优化 图像
下载PDF
基于OCR识别信息的语音合成在WEB上的实现 被引量:1
11
作者 彭伟 刘幺和 谭保华 《湖北工业大学学报》 2007年第2期41-44,共4页
系统使用OCR设备,扫描与识别学生卡信息,并对所得信息进行软件支持和补偿.在此基础上,建立了一个基于ASP.Net的在线考试系统.通过web技术与TTS技术相结合,实现了信息在不同客户端播报与提示,为外部信息转换到汉语文本进行探索,并为ATR... 系统使用OCR设备,扫描与识别学生卡信息,并对所得信息进行软件支持和补偿.在此基础上,建立了一个基于ASP.Net的在线考试系统.通过web技术与TTS技术相结合,实现了信息在不同客户端播报与提示,为外部信息转换到汉语文本进行探索,并为ATR实现语音播报打下基础. 展开更多
关键词 光学字符识别 文语转换 语音合成 网络服务
下载PDF
采用加权协方差矩阵描述子的OCR识别方法 被引量:1
12
作者 姬敬 《智能计算机与应用》 2012年第2期24-26,29,共4页
传统光学字符识别(Optical Character Recognition,OCR)方法一般只提取图像亮度特征,在图像退化较严重时识别准确率不高。针对这一问题,提出一种新的扫描字符特征提取方法。除各通道亮度外,还提取像素位置、亮度的一阶导、二阶导等特征... 传统光学字符识别(Optical Character Recognition,OCR)方法一般只提取图像亮度特征,在图像退化较严重时识别准确率不高。针对这一问题,提出一种新的扫描字符特征提取方法。除各通道亮度外,还提取像素位置、亮度的一阶导、二阶导等特征构成特征图像,并根据各个特征对图像的贡献程度进行加权处理。计算以当前像素为中心的局部区域特征图像块的协方差矩阵作为当前像素的描述子,然后在黎曼空间对字符实施分类。实验结果表明,采用典型的结构化分类器时,该特征提取方法对字符识别的准确率高于传统方法,表现出较强的鲁棒性。 展开更多
关键词 光学字符识别 协方差矩阵 特征提取 黎曼流形
下载PDF
基于OCR的人机交互界面翻译系统 被引量:4
13
作者 彭志明 曲宁 崔欣辰 《计算机应用》 CSCD 北大核心 2009年第B12期388-390,共3页
介绍了光学字符识别的一般方法,依据俄文字符在竖直书写位置的跨度特点对其进行了分类,并结合候选字符匹配法进而设计了一种两级分类器。运用这些技术实现了一种基于光学字符识别(OCR)技术的人机界面翻译系统。系统运行结果表明该系统... 介绍了光学字符识别的一般方法,依据俄文字符在竖直书写位置的跨度特点对其进行了分类,并结合候选字符匹配法进而设计了一种两级分类器。运用这些技术实现了一种基于光学字符识别(OCR)技术的人机界面翻译系统。系统运行结果表明该系统能够用于实际应用。 展开更多
关键词 光学字符识别 图像分割 特征提取 分类器 用户界面翻译
下载PDF
基于MQDF的英文OCR多模板分类器 被引量:4
14
作者 姜铮铟 丁晓青 《计算机工程》 EI CAS CSCD 北大核心 2005年第15期56-58,共3页
针对进一步提高英文OCR分类器的鲁棒性进行了研究,结合传统的单模板MQDF分类器和多模板欧氏距离分类器各自的优点,提出了一种新的基于MQDF的多模板分类器设计方法。与传统分类器的对比测试证明,该文提出的这种新的分类器能够有效地提高... 针对进一步提高英文OCR分类器的鲁棒性进行了研究,结合传统的单模板MQDF分类器和多模板欧氏距离分类器各自的优点,提出了一种新的基于MQDF的多模板分类器设计方法。与传统分类器的对比测试证明,该文提出的这种新的分类器能够有效地提高多体英文OCR字符的单字首选正确率,并对低质量文本中的模糊和断裂字符也能保持很高的识别率。 展开更多
关键词 光学字符识别 多模板 LDA变换 K均值聚类 MQDF分类器
下载PDF
A sustainable development OCR system in CADAL application 被引量:1
15
作者 黄晨 赵继海 胡晓 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第11期1312-1317,共6页
This paper briefly introduces the main ideas of a sustainable development OCR system based on open architecture techniques and then describes the construction of an optical character recognition (OCR) center built on ... This paper briefly introduces the main ideas of a sustainable development OCR system based on open architecture techniques and then describes the construction of an optical character recognition (OCR) center built on computer clusters, for the purpose of dynamically improving the recognition precision of the digitized texts of a million volumes of books produced by the China-US Million Books Digital Library (CADAL) Project. The practice of this center will provide helpful reference for other digital library projects. 展开更多
关键词 Sustainable Development Digital Library optical character recognition ocr China-US Million Books Digital Library (CADAL)
下载PDF
印刷体英文OCR系统的研究与实现 被引量:1
16
作者 蒋东玉 田英鑫 《智能计算机与应用》 2014年第4期111-112,117,共3页
OCR是一种文字自动识别技术,能够将图像中的文字输入到计算机中,属于非键盘输入范畴,使用到的图像输入设备主要是扫描仪。本文探讨了印刷体英文OCR的实现过程。通过对图像预处理,字符分割,字符识别三个主要模块的分析,使用了便于初学者... OCR是一种文字自动识别技术,能够将图像中的文字输入到计算机中,属于非键盘输入范畴,使用到的图像输入设备主要是扫描仪。本文探讨了印刷体英文OCR的实现过程。通过对图像预处理,字符分割,字符识别三个主要模块的分析,使用了便于初学者理解的算法来实现各模块的功能。设计清晰,实现简单,而且具有较快的识别速度和可接受的准确率。 展开更多
关键词 ocr技术 字符分割 字符识别
下载PDF
基于自定义模板的OCR技术及应用 被引量:2
17
作者 章倩 王梓祺 《指挥信息系统与技术》 2023年第5期94-98,共5页
信息资料电子化工作中,基于深度学习的光学字符识别(OCR)技术虽然是一种有效的文字识别方法,但也存在人工干预多以及结构化数据识别困难等问题。为了提高应用系统自动化程度以及满足用户定制化需求,提出了一种基于自定义模板的OCR技术... 信息资料电子化工作中,基于深度学习的光学字符识别(OCR)技术虽然是一种有效的文字识别方法,但也存在人工干预多以及结构化数据识别困难等问题。为了提高应用系统自动化程度以及满足用户定制化需求,提出了一种基于自定义模板的OCR技术。实际应用表明,基于自定义模板的OCR技术既可减少人工干预又可解决结构化数据识别问题,有助于提高信息加工与处理效率。 展开更多
关键词 光学字符识别技术 深度学习 自定义模板
下载PDF
OCR技术在企业文档识别中的研究与实践 被引量:4
18
作者 王秀光 尹世阁 《信息与电脑》 2022年第18期175-178,共4页
本文介绍了某轨道交通制造企业文档识别项目的建设背景、设计方案以及项目建设过程,利用先进的光学字符识别(Optical Character Recognition,OCR)技术提升了纸质文档管理效率,并总结和建立了企业的OCR平台的通用集成标准规范,使各业务... 本文介绍了某轨道交通制造企业文档识别项目的建设背景、设计方案以及项目建设过程,利用先进的光学字符识别(Optical Character Recognition,OCR)技术提升了纸质文档管理效率,并总结和建立了企业的OCR平台的通用集成标准规范,使各业务系统所需录入文档能够在短时间内识别完成,并集成于OCR平台进行存储和管控,进而提升处理效率,在企业的研发、生产以及运营环节节省更多人力。 展开更多
关键词 光学字符识别(ocr)技术 企业 文档识别 文档要素抽取
下载PDF
Baseline Isolated Printed Text Image Database for Pashto Script Recognition
19
作者 Arfa Siddiqu Abdul Basit +3 位作者 Waheed Noor Muhammad Asfandyar Khan M.Saeed H.Kakar Azam Khan 《Intelligent Automation & Soft Computing》 SCIE 2023年第7期875-885,共11页
The optical character recognition for the right to left and cursive languages such as Arabic is challenging and received little attention from researchers in the past compared to the other Latin languages.Moreover,the... The optical character recognition for the right to left and cursive languages such as Arabic is challenging and received little attention from researchers in the past compared to the other Latin languages.Moreover,the absence of a standard publicly available dataset for several low-resource lan-guages,including the Pashto language remained a hurdle in the advancement of language processing.Realizing that,a clean dataset is the fundamental and core requirement of character recognition,this research begins with dataset generation and aims at a system capable of complete language understanding.Keeping in view the complete and full autonomous recognition of the cursive Pashto script.The first achievement of this research is a clean and standard dataset for the isolated characters of the Pashto script.In this paper,a database of isolated Pashto characters for forty four alphabets using various font styles has been introduced.In order to overcome the font style shortage,the graphical software Inkscape has been used to generate sufficient image data samples for each character.The dataset has been pre-processed and reduced in dimensions to 32×32 pixels,and further converted into the binary format with a black background and white text so that it resembles the Modified National Institute of Standards and Technology(MNIST)database.The benchmark database is publicly available for further research on the standard GitHub and Kaggle database servers both in pixel and Comma Separated Values(CSV)formats. 展开更多
关键词 Text-image database optical character recognition(ocr) pashto isolated characters visual recognition autonomous language understanding deep learning convolutional neural network(CNN)
下载PDF
AI Cannot Understand Memes:Experiments with OCR and Facial Emotions
20
作者 Ishaani Priyadarshini Chase Cotton 《Computers, Materials & Continua》 SCIE EI 2022年第1期781-800,共20页
The increasing capabilities of Artificial Intelligence(AI),has led researchers and visionaries to think in the direction of machines outperforming humans by gaining intelligence equal to or greater than humans,which m... The increasing capabilities of Artificial Intelligence(AI),has led researchers and visionaries to think in the direction of machines outperforming humans by gaining intelligence equal to or greater than humans,which may not always have a positive impact on the society.AI gone rogue,and Technological Singularity are major concerns in academia as well as the industry.It is necessary to identify the limitations of machines and analyze their incompetence,which could draw a line between human and machine intelligence.Internet memes are an amalgam of pictures,videos,underlying messages,ideas,sentiments,humor,and experiences,hence the way an internet meme is perceived by a human may not be entirely how a machine comprehends it.In this paper,we present experimental evidence on how comprehending Internet Memes is a challenge for AI.We use a combination of Optical Character Recognition techniques like Tesseract,Pixel Link,and East Detector to extract text from the memes,and machine learning algorithms like Convolutional Neural Networks(CNN),Region-based Convolutional Neural Networks(RCNN),and Transfer Learning with pre-trained denseNet for assessing the textual and facial emotions combined.We evaluate the performance using Sensitivity and Specificity.Our results show that comprehending memes is indeed a challenging task,and hence a major limitation of AI.This research would be of utmost interest to researchers working in the areas of Artificial General Intelligence and Technological Singularity. 展开更多
关键词 Technological singularity optical character recognition transfer learning convolutional neural networks(CNN) region-based convolutional neural networks(RCNN)
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部