期刊文献+

一种基于OCR技术的档案目录数据构建方法探究

原文传递
导出
摘要 OCR技术在快速构建档案目录数据库的任务中能够发挥重大作用。基于OCR识别的档案目录数据库构建方法的处理流程,包括数据分类、建立模板、OCR识别、信息输出、校对等五个环节。在毕业证、学位证等教学档案管理中,使用商用软件ABBYY Fine Reader和开源免费软件Tesseract能够快速、有效、自动化地完成档案目录数据的构建工作。
作者 武华维
出处 《档案》 2017年第5期60-63,共4页 ARCHIVES
  • 相关文献

参考文献6

二级参考文献28

  • 1邢立民,陈永琴.扫描仪的OCR技术[J].实验室科学,2006,9(6):58-59. 被引量:6
  • 2迟春佳.OCR技术及其在高校图书馆信息资源数字化建设中的应用[J].中国科技信息,2007(7):95-96. 被引量:11
  • 3Mori S.Historical review of OCR research and development[J].IEEE,1992,80(7):1029-1058.
  • 4Nagasaki T,Takaheshi T,Marukawa K.Document retrieval system.Tolerant of segmentation errors of document images[C]//Proc.of the 9th International Workshop on Frontiers in Handwriting Recognition.Tokyo,Japan,2004:280-285.
  • 5Tan C L,Huang Weihua,Yu Zhaohui.Imaged document text retrieval without OCR[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2002,24(6):838-844.
  • 6Richard S Hunter.Abstract[J].Journal of the Optical Society of America,1948,38:661.
  • 7Stefano L,Mattoccia S.Real-time stereo within the VIDET project[J].Real-Time Imaging,2002,8(5):439-453.
  • 8Wikimedia Foundation.Tesseract[EB/OL].Tesseract software.http://en.wikipedia.org/wiki/Tesseract_(software),2009-04-01.
  • 9Google.Tesseract-ocr Project[EB/OL].http://code.google.com/p/tesseract-ocr/,2009-04-01.
  • 10章毓晋.图像分割[M].北京:科学出版社,2003..

共引文献28

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部