摘要
文本抽取是信息检索的一个重要问题。设计并实现了一个利用IFilter接口的过滤器组件,抽取非文本文件的文本信息的程序。对这一设计过程论述了其主要的关键技术。
Extracting text is an important issue in information retrieval.This paper designs and implements a program that extracts text message of non-text file by using filter components implementing IFilter interface.It discusses major key technologies of the design process.
出处
《电脑知识与技术》
2011年第9X期6682-6683,共2页
Computer Knowledge and Technology
基金
广西教育厅科研项目(200808LX211)