摘要
基于Internet的信息挖掘是数据挖掘技术中的重要组成部分,也是网络信息处理领域中的一项新课题。本文介绍了Internet上的电子文档信息自动挖掘的概念和系统的体系结构,并给出了文档结构图解析、文档分类检索等电子文档自动挖掘的预处理过程及处理程序。
Internet information mining is an important data mining techniques, also a new problem in the domain of net information processing. This paper describes the concept and system structure of automatic information mining based on internet electronic documents, The pre -processing procedure and programs are given in the paper, for automatic information mining of electronic documents, such as the analysis of the documental strctural drawing and documental classified index,etc.
出处
《计算技术与自动化》
2002年第2期92-96,共5页
Computing Technology and Automation
基金
湖南省教育厅资助项目(项目编号:01C012)