基于Tesseract中文全血化验单信息提取研究被引量：1

下载PDF

导出

摘要设计基于Tesseract引擎针对全血化验单内容的识别系统。利用混合边缘检测算子对图片进行边缘检测,排除背景噪声。通过透视变换、霍夫直线检测对图像进行倾斜校正,利用投影法切分不同类型字符识别区域,对切分的项目名称和结果利用二维OTSU(大津算法)法对相应的图像进行二值化。利用Tesseract引擎使用集束搜索算法和K-近邻算法(KNN)进行预识别,经过校正后,重新训练生成全血化验单识别字库,利用生成字库进行识别。经过实验,该系统识别率为96.4%。该系统的实现,弥补了市场空白,避免手动输入的繁琐,提高了效率,有助于历史医疗数据保存和医疗大数据的发展。

作者梁国贤陈广华梁国胜

机构地区北京交通大学机械与电子工程控制学院兰州大学物理科学与技术学院

出处《电脑编程技巧与维护》 2020年第4期96-100,128,共6页 Computer Programming Skills & Maintenance

基金国家自然科学基金(51376017).

关键词文字识别图像处理全血化验单识别 Tesseract引擎

分类号 R197.3 [医药卫生—卫生事业管理] TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1张庆元.血液细胞形态学检查在血常规检测应用中的临床意义探讨[J].临床医药文献电子杂志,2019,6(23):161-161. 被引量：2
2张淙悦,尹梓名,孙大运,戴维.基于Tesseract的医学化验单内容识别技术[J].北京生物医学工程,2019,38(3):283-289. 被引量：16
3姜嘉佳.OCR技术在报刊加工中的应用分析[J].科技传播,2019,11(10):159-160. 被引量：4
4孙国栋,车大伟.一种基于反馈的车牌图像二值化方法[J].自动化技术与应用,2019,38(2):135-139. 被引量：6
5郭室驿.基于OpenCV和Tesseract-OCR的英文字符算法研究[J].电脑编程技巧与维护,2019,0(6):45-49. 被引量：13
6李毅荣,郭磊,张漫杨.基于Tesseract-OCR的快递单中手机号码识别应用的实现[J].电子测试,2018,29(22):8-10. 被引量：7
7李凌.基于Canny的边缘检测改进算法[J].通化师范学院学报,2019,40(6):61-64. 被引量：8
8王卓,葛斌,涂明玉,严荣国.基于改进大津法与人工鱼群优化的图像分割算法[J].包装学报,2019,11(2):81-86. 被引量：11

二级参考文献40

1李俊山,马颖,赵方舟,郭莉莎.改进的Canny图像边缘检测算法[J].光子学报,2011,40(S1):50-54. 被引量：64
2陶新宇.《全国报刊索引数据库》刍议[J].现代情报,2004,24(9):9-10. 被引量：5
3刘健庄,栗文青.灰度图象的二维Otsu自动阈值分割法[J].自动化学报,1993,19(1):101-105. 被引量：359
4张震,马驷良,张忠波,刘辉,宫跃欣,孙秋成.一种改进的基于Canny算子的图像边缘提取算法[J].吉林大学学报（理学版）,2007,45(2):244-248. 被引量：53
5范九伦,赵凤.灰度图像的二维Otsu曲线阈值分割法[J].电子学报,2007,35(4):751-755. 被引量：150
6王枚,王国宏,潘国华.融合边缘检测与HSV颜色特征的车牌定位技术[J].计算机应用研究,2007,24(8):209-211. 被引量：6
7吴一全,吴文怡,潘喆.二维最大类间方差阈值分割的快速迭代算法[J].中国体视学与图像分析,2007,12(3):216-220. 被引量：33
8岳峰,左旺孟,王宽全.基于分解的灰度图像二维阈值选取算法[J].自动化学报,2009,35(7):1022-1027. 被引量：43
9潘喆,吴一全.二维Otsu图像分割的人工鱼群算法[J].光学学报,2009,29(8):2115-2121. 被引量：33
10薛丽霞,李涛,王佐成.一种自适应的Canny边缘检测算法[J].计算机应用研究,2010,27(9):3588-3590. 被引量：90

共引文献57

1程鑫,同军超,施恢胜,张帆,吴臻冕,张卫超.弱光条件下非规则曲面上浅刻蚀字符的识别研究[J].数字制造科学,2021(2):81-86.
2王杰,孙心怡,金曙,张学伟,汪林.一种图像中相交直线角度计算方法[J].科技视界,2019,0(23):57-58.
3刘科征,曾德港.基于嵌入式系统的手写数字识别实验设计[J].数码世界,2019,0(8):111-112. 被引量：2
4山毓俊,王凤伟,刘娜,李凡.利用图像比较实现纸质原始记录关键数据区域自主提取与识别[J].电脑编程技巧与维护,2019,0(12):155-156. 被引量：1
5龙之冠.征地档案数字识别研究与应用[J].国土资源导刊,2019,16(4):81-86. 被引量：1
6詹文良,孙涛,蔡梦纯,崔宏健,李岩.应用OpenCV的工商信息提取系统[J].福建电脑,2019,35(12):73-75. 被引量：1
7段志达,魏利胜,丁坤.一种新型Canny边缘检测算法研究[J].牡丹江大学学报,2020,29(1):92-97. 被引量：6
8阮颐,宋清亮,王甲.基于Python的示波器图像数据识别[J].集成电路应用,2020,37(1):18-19. 被引量：3
9王来兵.基于混合深层网络与云平台计算的车牌识别系统[J].重庆科技学院学报（自然科学版）,2020,22(1):71-75. 被引量：1
10张巍然,侯艳红.一种基于安卓平台的车牌识别系统[J].自动化应用,2020,0(2):53-54. 被引量：1

同被引文献6

1张艳,张重阳,郁生阳,杨静宇.基于框线检测的票据图像分类方法[J].南京理工大学学报,2007,31(4):409-413. 被引量：6
2赵懿琨,马劼聪,陈仰丽,余晓佳,黄国伟,何绮岚,陈运福.基于于MATLAB的票据自动报账系统设计与实现[J].现代农业研究,2018,24(10):107-109. 被引量：1
3张淙悦,尹梓名,孙大运,戴维.基于Tesseract的医学化验单内容识别技术[J].北京生物医学工程,2019,38(3):283-289. 被引量：16
4张岩.人工智能和大数据对会计学科发展的影响[J].当代会计,2020(3):14-15. 被引量：5
5张庆龙.下一代财务:数字化与智能化[J].财会月刊,2020(10):3-7. 被引量：116
6李宗民.基于会计信息智能化管理的票据图像处理与识别[J].河南科学,2020,38(9):1394-1399. 被引量：5

引证文献1

1李沛霖,吕巍,姚琳,尚丹梅.基于Tesseract的会计票据图像识别系统设计研究[J].中国管理信息化,2021,24(17):107-110. 被引量：2

二级引证文献2

1薛静,陈鹏,朱魁,孙精通.计算机图像处理和识别技术在中药研究中的应用进展[J].天津药学,2023,35(4):69-73. 被引量：3
2谭静.基于Tesseract-OCR的农村房地一体归档系统研究[J].黑龙江科学,2024,15(12):154-157.

1修春波,李欣.融合分数阶微分边缘特征的自适应跟踪[J].光学精密工程,2019,27(1):241-250. 被引量：5
2黄建国,唐烨伟,范佳荣,钟绍春.基于xAPI的在线学习环境中精准师训画像构建研究[J].中国电化教育,2020(4):102-108. 被引量：21
3田芙荣,刘静静(指导),陈方苇.基于CNN的文字识别系统设计[J].浙江树人大学学报（自然科学版）,2019,0(3):12-17. 被引量：1
4张欣彧,尤鸣宇,朱江,韩煊.基于联合损失函数的小规模数据人脸识别[J].北京理工大学学报,2020,40(2):163-168. 被引量：11
5王惠丽,杨松林.计算机图像识别技术及应用研究[J].信息与电脑,2020,32(5):30-31. 被引量：1
6张举世.改进的狼群优化二维Otsu阈值分割算法[J].电力学报,2020,0(1):40-45. 被引量：2
7许建军,李志勇,党维维.质量安全标准检查信息化在铁路建设中的应用[J].铁道勘察,2020,46(2):106-109.
8温春云,吴敦华,吴煜晨,胡芳,刘聚涛.基于DEM数据与GIS技术方法的水文信息提取研究——以莲花县为例[J].江西水利科技,2020,46(2):118-123. 被引量：3
9邵峰,俞梦莹,蒋美林,杨明,尚悦,刘荣华,张学瑜.2种根类药材醇沉絮体的分形维数测定方法建立[J].中国实验方剂学杂志,2019,0(22):103-107.
10项宇杰,陈月芬,卢卫国,潘佳浩.基于深度卷积神经网络的木材表面缺陷检测系统设计[J].系统仿真技术,2019,15(4):253-257. 被引量：6

电脑编程技巧与维护

2020年第4期

浏览历史

内容加载中请稍等...

基于Tesseract中文全血化验单信息提取研究被引量：1

参考文献8

二级参考文献40

共引文献57

同被引文献6

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于Tesseract中文全血化验单信息提取研究 被引量：1

参考文献8

二级参考文献40

共引文献57

同被引文献6

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于Tesseract中文全血化验单信息提取研究被引量：1