摘要
针对不同类型的中文网页及网页中含有文字的图片,提出了提取文字信息的几种方法,解决了特殊中文网页中文字信息无法提取的问题。
Because of different types of Chinese Webpage and pictures containing words, this thesis proposes several methods of extracting word information from Chinese Webpage. It further solves the problem of how to extract word information from special Chinese Webpage.
出处
《电脑与电信》
2007年第10期80-81,共2页
Computer & Telecommunication
关键词
中文网页
文字信息
提取
浏览器
OCR
Chinese Webpage
word information
extraction
browser
OCR