摘要
传统的特定发票识别系统,只能针对某一种样式的特定发票进行识别,发票的样式、大小、种类不能有任何变化,否则将不能识别。针对这种情况提出一种新的机打发票识别算法,通过图像处理算法自动定位文字和条款项,并通过支持超大汉字集合的Tesseract-OCR识别引擎与神经网络相结合,识别出发票条款项的具体内容。这种方法可以自动定位文字位置和识别内容项,可以适应一定的发票样式、大小和字体变化,更具有通用性。
出处
《信息与电脑(理论版)》
2015年第18期43-45,共3页
China Computer & Communication